Современные языковые модели часто ошибаются из-за неопределённости в обработке информации. Например, на вопрос «Сколько лет Роджеру Федереру и сколько у него детей?» ИИ может выдать только возраст, проигнорировав данные о семье, или придумать несуществующие факты. Проблема в том, как модели выбирают информацию: они либо опираются на неполные данные, либо «залипают» на одной теме, теряя контекст.
Швейцарские учёные из Цюриха разработали алгоритм SIFT (Semantically Informed Feature Transformation), который решает эту проблему, подбирая данные, максимально дополняющие вопрос. Это не просто поиск «похожих» слов, а сложный анализ, который делает ответы более полными и точными.
Как работает SIFT?
SIFT использует математический подход, основанный на векторах в многомерном пространстве, где слова и их смыслы представлены как точки. Чем ближе векторы, тем выше их семантическая связь. Но вместо того чтобы выбирать ближайшие данные (как в методе «ближайшего соседа»), SIFT ищет информацию, которая дополняет контекст, избегая повторов.
Vzglyad.az
Читайте актуальные новости и аналитические статьи в Telegram-канале «Vzglyad.az» https://t.me/Vzqlyad
Тэги: