Exercício – Executar a regressão linear com o Scikit-learn

Concluído

Outra biblioteca popular do Python que é amplamente usada na comunidade de pesquisas é o Scikit-learn, que se destaca na criação de modelos de machine learning para ajudar a extrair informações de dados. Neste exercício, você usará o Scikit-learn (que já foi importado na Unidade 2 para calcular uma linha de tendência para os dados de clima da NASA).

  1. Coloque o cursor na célula vazia na parte inferior do notebook. Altere o tipo de célula para Markdown e insira "Executar regressão linear com o Scikit-learn" como o texto.

  2. Adicione uma célula de Código e cole o código a seguir.

    # Pick the Linear Regression model and instantiate it
    model = LinearRegression(fit_intercept=True)
    
    # Fit/build the model
    model.fit(yearsBase[:, np.newaxis], meanBase)
    mean_predicted = model.predict(yearsBase[:, np.newaxis])
    
    # Generate a plot like the one in the previous exercise
    plt.scatter(yearsBase, meanBase)
    plt.plot(yearsBase, mean_predicted)
    plt.title('scatter plot of mean temp difference vs year')
    plt.xlabel('years', fontsize=12)
    plt.ylabel('mean temp difference', fontsize=12)
    plt.show()
    
    print(' y = {0} * x + {1}'.format(model.coef_[0], model.intercept_))
    
  3. Agora, execute a célula para exibir um gráfico de dispersão com uma linha de regressão.

    Scatter plot with regression line computed by sckikit-learn.

    Gráfico de dispersão com linha de regressão calculada pelo Scikit-learn

A saída é quase idêntica à saída do exercício anterior. A diferença é que o Scikit-learn fez a maior parte do trabalho para você. Especificamente, você não precisou codificar uma função de linha como fez com o NumPy; a função LinearRegression do Scikit-learn fez isso para você. O Scikit-learn é compatível com muitos diferentes tipos regressão, que são úteis na criação de modelos de machine learning sofisticados.