Classificação

11 Aug 2019

Regressão Logística

Apesar do nome, este é um modelo usado para resolver problemas de classificação. Como mencionado anteriormente, em problemas de classificação, nosso objetivo é prever uma resposta binária, como sim ou não, certo ou errado, e assim por diante.

E por que usar um modelo de regressão logística em vez de um modelo de regressão linear?

As variáveis binárias não se encaixam nas suposições de linearidade, uma vez que não possuem respostas contínuas, ao contrário da regressão linear, que lida com valores que podem ser superiores a 1 e inferiores a 0.

Ao aplicar uma regressão linear a um conjunto de dados binários, nosso modelo simplesmente não conseguiria prever novas entradas de forma eficaz e, se as entradas fossem baixas, teríamos valores que se aproximariam de números negativos, o que não faz sentido nesse contexto.

Devido a esse desafio na utilização de modelos lineares, torna-se necessário o uso de modelos de regressão logística.

Nesse caso, algumas modificações são necessárias no modelo linear:

Com essas modificações, nosso modelo de regressão logística consegue prever com precisão respostas binárias, sem ser afetado por valores extremamente altos ou baixos que possam surgir nos dados.