O algoritmo Naive Bayes, como o próprio nome sugere, é baseado no teorema de Bayes. Ele é amplamente utilizado para classificar texto com base na ocorrência de palavras ou para prever um fenômeno com base em outros fatores.
O Naive Bayes nos fornece a probabilidade de um fenômeno ocorrer, dado que outro fenômeno já ocorreu, como, por exemplo, a probabilidade de haver trânsito dado que está chovendo, ou dado que está ensolarado, e assim por diante.
Aqui está a fórmula do teorema:
Ela nos dá a probabilidade de ocorrer o evento B, dado que ocorreu o evento A.
Para calcular isso, multiplicamos a probabilidade de ocorrer o evento A dado o evento B pela probabilidade de ocorrer o evento A e, em seguida, dividimos essa multiplicação pela probabilidade de ocorrer o evento B.
Vamos usar um exemplo com o tempo e o trânsito para calcular a probabilidade de ter trânsito quando está chovendo.
Nesta tabela, temos a frequência de ocorrências de trânsito quando choveu e quando fez sol. Para responder à pergunta, primeiro calculamos a probabilidade de chover quando há trânsito, em seguida a probabilidade de chover e, por fim, a probabilidade de ter trânsito.
Aqui estão os valores calculados:
P(B | A): 8/14 = 0.571 |
Portanto, a probabilidade de haver trânsito quando está chovendo (P(A|B)) é (0.571 * 0.407) / 0.518 = 0.449 ou 44,9%.
Este é um exemplo fictício, mas para quem mora em São Paulo, o trânsito é uma realidade constante.