Пятница, 19 Января 2024

Посмотрел интрересное видео о langchain. По сути это библиотечка на питоне и жс чтобы самому не делать запросы к ЛЛМам, а она позволяет это сделать в более удобном формате. Плюс далее можно обработать данные которые вернет ллм

видео

Пару интересных мыслей которые встретил за последнее время

реинфорсмент лернинг это способ превращения вычеслительных мощностей в данные. По сути это тоже самое что и обычные алгоритмы машинного обучения, только с включением способа генерации данных
если запустить процесс генерации ответа 10000 раз, один из ответов будет довольно хорош. Но моделька не знает какой

Как решение проблемы галюцинаций, можно сделать верификацию ответов на примере колективных знаний и експертов. Колективные знания - это когда 1000 ответов говорят об одном и том же, скорей всего это близко к истене. Експерты - это маленькие ллмы, заточенные под одну область. И большая советуется с ними. А можно сделать консилиум экспертов, много ответов экспертной модели, если говорят об одном и том же, то скорей всего не придумала. Также можно сделать консилиум иностранных експертов, разные модели, обученые на разных данных.