Пятница, 19 Января 2024
Посмотрел интрересное видео о langchain. По сути это библиотечка на питоне и жс чтобы самому не делать запросы к ЛЛМам, а она позволяет это сделать в более удобном формате. Плюс далее можно обработать данные которые вернет ллм
Пару интересных мыслей которые встретил за последнее время
- реинфорсмент лернинг это способ превращения вычеслительных мощностей в данные. По сути это тоже самое что и обычные алгоритмы машинного обучения, только с включением способа генерации данных
- если запустить процесс генерации ответа 10000 раз, один из ответов будет довольно хорош. Но моделька не знает какой
Как решение проблемы галюцинаций, можно сделать верификацию ответов на примере колективных знаний и експертов. Колективные знания - это когда 1000 ответов говорят об одном и том же, скорей всего это близко к истене. Експерты - это маленькие ллмы, заточенные под одну область. И большая советуется с ними. А можно сделать консилиум экспертов, много ответов экспертной модели, если говорят об одном и том же, то скорей всего не придумала. Также можно сделать консилиум иностранных експертов, разные модели, обученые на разных данных.