Banco público de perguntas reais para entrevistas: explore por empresa, categoria e tema
CodingStaff+

Implement and Optimize a K-Nearest Neighbors Classifier

Build a KNN classifier that handles edge cases like tie-breaking, data quality issues, and feature scaling. Address production concerns including noisy data, identical feature vectors with different labels, and appropriate distance metrics for different data types.

Empresas em que apareceu
IntuitIntuitYahooYahoo
Contextos reais

Onde essa pergunta já apareceu

Use esses exemplos para entender em que contexto ela costuma cair e adaptar sua prática.

Intuitstaff_plusfev. de 2026

Sem observação adicional neste relato público.

Yahoojuniorjan. de 2026

- **Metric choice – “Which similarity metric will you use?”** - Chose cosine for text‑like vectors; mentioned Euclidean as alternative. - **Tie handling – “Why does the KNN return ‘Sports’ instead of ‘Technology’?”** - Explained Counter.most_common() tie‑break order; proposed weighted voting or explicit tie‑break by avg distance. - **Data ambiguity – “What if identical feature vectors have different labels?”** - Classified as data‑quality issue; suggested validation to deduplicate or keep most frequent label. - **Production robustness – “How would you handle noisy or overlapping data?”** - Outlined schema‑level checks, semantic stats, confidence thresholding, fallback heuristics. - **Feature scaling – “What about vastly different feature ranges?”** - Recommended Min‑Max or z‑score normalization before distance calculation. - **Aggregation – “Two identical‑category points – keep or aggregate?”** - Keep both for redundancy or replace with mean centroid for efficiency; justified mean choice. - **Mean vs. median – “When is mean not appropriate?”** - Outliers skew mean; would switch to median or trimmed mean in such cases.

Anexos públicos

Materiais associados

Nenhum anexo público associado a esta pergunta.

Sinais de resposta forte
Você deixa claro por que escolheu essa abordagem e o que descartou.
Seu código vem acompanhado de testes mentais e edge cases relevantes.
Sua explicação ajuda o entrevistador a acompanhar o raciocínio em tempo real.
O que costuma enfraquecer a resposta
Entrar direto no código sem alinhar interpretação do problema.
Passar tempo demais em silêncio e só explicar no fim.
Ignorar complexidade, invariantes e estratégia de teste.

Continue a preparação com o banco completo

No app você encontra perguntas parecidas, compara empresas e aprofunda essa busca com mais filtros.