Среда, 11 Октября 2023
Закончил курс intemediate machine learning, изучил утечку данных. Она бывает двух видов: утечка цели и засорение трейн теста. Утечка цели это когда тренировочные данные содержат данные, которые достпны только тогда когда цель уже определена. Например антибиотики дают только людям которым поставили диагноз и мы не можем использовать признак дают ли антибиотики для предсказывания диагноза.
Засорение трейт теста это когда данные из трейн переходят в тест: например среднее по всем значениям использую симпл импутер до того как данные разделились на трейт тест
Начал изучать дип лернинг