Se adicionarmos novos atributos que fazem uma transformação não linear nos dados (como na aula passada, em que fizemos regressão polinomial adicionando atributos do tipo xk)
Por exemplo, se adicionarmos atributos quadráticos, podemos ter fronteiras de decisão do tipo
Cost(hθ(x),y)={−log(hθ(x))−log(1−hθ(x))sey=1sey=0
Cost(hθ(x),y)=−ylog(hθ(x))−(1−y)log(1−hθ(x))
θ:=θ−αi∑m(hθ(xi)−yi)xi
Essa equação é a mesma da regressão linear
Colocar os atributos na mesma escala também pode ser necessário
Existem outras possíveis maneiras de minizar a função de custo
São algoritmos mais complexos e otimizados, que podem ser aplicados à mesma entrada e função de custo