Сбор и систематизация некоторых базовых понятий
Алгоритмы машинного обучения — это алгоритмы, способные обучаться на данных. Mitchell (1997) определяет машинное обучение следующим образом: "Компьютерная программа считается способной обучаться на опыте E
для задачи T
и метрики P
, если её производительность по метрике P
для задачи T
улучшается с опытом E
."
Основной проблемой машинного обучения является необходимость того, чтобы алгоритмы могли хорошо работать на новых, ранее не наблюдавшихся входных данных, а не только на обучающей выборке. Способность хорошо работать на новых входных данных называется обобщением (generalization).
Вот факторы, определяющие качество алгоритма машинного обучения:
Эти факторы соответствуют двум основным проблемам машинного обучения: недообучению (underfitting) и переобучению (overfitting).
До появления ELMO и BERT, обычно подразумеваемые языковые модели были автoregressive, то есть они предсказывали следующее слово на основе предыдущего контекста, то есть выполняли задачу слева направо. Или наоборот, предсказывали предыдущее слово на основе последующего контекста. Такие модели языка называются автoregressive. GPT является типичным примером автoregressive модели.
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )