Objetivo: Descobrir quais são as consoantes que mais aparecem na Língua Portuguesa.
O jogo Termo, disponível no online através do link https://term.ooo/ é um jogo de adivinhação de palavras criado por Fernando Serboncini, baseado no jogo inglês Wordle. O jogador conta com 6 tentativas para adivinhar a palavra do dia, que sempre contém 5 letras. O objetivo é claro: você deve adivinhar a palavra do dia em 6 tentativas, quanto antes acertar, melhor. Para guiá-lo, você conta com um sistema de coloração para indicar se alguma letra da palavra chutada faz parte da palavra do dia e se está na posição correta. É um jogo viciante e na medida certa, uma vez que você precisa esperar o dia seguinte se quiser jogar novamente.
Apesar de não jogar todos os dias, sempre que me lembro eu reservo alguma parte do meu tempo para descobrir a palavra do dia e convidar meus amigos a fazerem o mesmo. E hoje, venho aqui falar da minha estratégia de jogo e uma análise que fiz para melhorar a minha estratégia.
Bom, como a maioria das palavras brasileiras possuem ao menos uma vogal, minha estratégia para começar o jogo consiste em começar com uma palavra que contenha algumas vogais distintas (Por exemplo: ”feira”, “dueto”, “audio “) . Assim posso descobrir quais vogais possuem na palavra. Entretanto, as consoantes são diversas que as vogais, contamos com 21 delas. Então sempre fico na dúvida de quais palavras chutar para tentar descobrir a vogal presente.
Claramente, no léxico brasileiro, algumas aparecem mais, outras menos (por exemplo: X,W,K), mas quais são as que mais aparecem? Na hora de chutar uma palavra para tentar adivinhas as consoantes, quais palavras seriam uma boa escolha? Foi a partir dessas dúvidas que resolvi usar algumas ferramentas de análise de dados para achar as respostas.
Para isso, peguei o conjunto de palavras disponibilizado nesse repositório do GitHub, que aliás, é o mesmo utilizado pelo criador do jogo. A partir dai, usando o Python, criei um subconjunto contendo apenas palavras com 5 letras. E, a partir desse subconjunto, contei a frequência de cada letra e ordená-las de acordo com suas frequências.
Com isso, descobri que as 5 consoantes que mais aparecem são: “r”, “s”, “c”, “l” e “m” e agora já tenho uma ideia de quais consoantes testar na hora de adivinhar a palavra do dia.
Indo Além nas Análises
Bom, a partir daqui as informções obtidas podem tornar o jogo não mais tão interessante.Mas as fiz para fim sanar minha curiosidade.
A ideia é saber quais as letras acompanham com mais frequência cada vogal. Já que na minha estratégia de jogo as vogais são descobertas primeiro, seria interessante se eu descobrisse quais as letras frequentemente acompanham minha vogal.