Banco público de perguntas reais para entrevistas: explore por empresa, categoria e tema
NaGringa
System DesignStaff+

Design Wikipedia Crawler

Design a distributed web crawler system that can crawl and store Wikipedia pages at scale using multiple machines or edge devices, with focus on coordination, deduplication, and efficient resource utilization.

Empresas em que apareceu
MetaMetaLyftLyftGoogleGoogle
Contextos reais

Onde essa pergunta já apareceu

Use esses exemplos para entender em que contexto ela costuma cair e adaptar sua prática.

Metamiddez. de 2025

Specifically asked to design a "system to scrape a particular website" where the scraping was done by mobile clients and the coordination between the scraping clients was done by a cloud service, which also stored the results.

Googlestaff_plusnov. de 2025

Sem observação adicional neste relato público.

Lyftstaff_plusago. de 2025

A system that can use edge devices to archive wikipedia

Anexos públicos

Materiais associados

Nenhum anexo público associado a esta pergunta.

Sinais de resposta forte
Você mostra decisões explícitas, não só uma lista de componentes.
Há trade-offs claros entre simplicidade, custo, latência e consistência.
A solução fecha com gargalos, riscos e próximos passos de evolução.
O que costuma enfraquecer a resposta
Pular requisitos e ir direto para uma arquitetura decorada.
Nomear tecnologias sem explicar por que elas resolvem o problema.
Encerrar a resposta sem discutir falhas, abuso, operação ou trade-offs.

Continue a preparação com o banco completo

No app você encontra perguntas parecidas, compara empresas e aprofunda essa busca com mais filtros.