Воскресенье, 8 Октября 2023
Закончил изучать кросс валидацию, способ как можно улучшить валидацию модели, понять насколько она качественная. Для этого весь X разбивается на равные части, и попеременно все кроме одной части участвуют в тренировке и одна в валидации.
from sklearn.ensemble import RandomForestRegressor
from sklearn.pipeline import Pipeline
from sklearn.impute import SimpleImputer
my_pipeline = Pipeline(steps=[('preprocessor', SimpleImputer()),
('model', RandomForestRegressor(
n_estimators=50,
random_state=0)
)])
from sklearn.model_selection import cross_val_score
# Multiply by -1 since sklearn calculates *negative* MAE
scores = -1 * cross_val_score(my_pipeline, X, y, cv=5,
scoring='neg_mean_absolute_error')
print("MAE scores:\n", scores)
Начал изучать XGBoost