← На главную Воспоминания

Среда, 11 Октября 2023

Закончил курс intemediate machine learning, изучил утечку данных. Она бывает двух видов: утечка цели и засорение трейн теста. Утечка цели это когда тренировочные данные содержат данные, которые достпны только тогда когда цель уже определена. Например антибиотики дают только людям которым поставили диагноз и мы не можем использовать признак дают ли антибиотики для предсказывания диагноза.

Засорение трейт теста это когда данные из трейн переходят в тест: например среднее по всем значениям использую симпл импутер до того как данные разделились на трейт тест

Начал изучать дип лернинг