← На главную Воспоминания

Воскресенье, 8 Октября 2023

Закончил изучать кросс валидацию, способ как можно улучшить валидацию модели, понять насколько она качественная. Для этого весь X разбивается на равные части, и попеременно все кроме одной части участвуют в тренировке и одна в валидации.

from sklearn.ensemble import RandomForestRegressor
from sklearn.pipeline import Pipeline
from sklearn.impute import SimpleImputer
        
my_pipeline = Pipeline(steps=[('preprocessor', SimpleImputer()),
        ('model', RandomForestRegressor(
                n_estimators=50,
                random_state=0)
        )])


from sklearn.model_selection import cross_val_score

# Multiply by -1 since sklearn calculates *negative* MAE
scores = -1 * cross_val_score(my_pipeline, X, y, cv=5,
                scoring='neg_mean_absolute_error')

print("MAE scores:\n", scores)

Начал изучать XGBoost