Глоссарий
Терминология
Изучая искусственный интеллект и машинное обучение, вы столкнетесь со многими общими терминами и сокращениями. В этой главе будут объяснены ключевые понятиями, чтобы помочь вам лучше понять основные концепции, используемые в этой области.
Основные термины и сокращения
Агент ИИ: автономная вычислительная система, предназначенная для взаимодействия с окружающей средой посредством датчиков (восприятие) и исполнительных механизмов (действия). Она автономно обрабатывает входные данные, рассуждает о своих целях и предпринимает соответствующие действия для достижения указанных целей, часто адаптируясь к изменяющимся условиям и обучаясь с течением времени.
Алгоритм: последовательность шагов или правил, которым следует компьютер для решения определенной задачи или проблемы. В МО алгоритмы используются для анализа данных, распознавания закономерностей и создания моделей.
Данные для обучения: набор данных, используемый для обучения модели машинного обучения. Он содержит входные данные (признаки) и правильные выходные данные (метки), которые помогают модели изучать особенности и закономерности данных.
Интеллект: естественная или искусственная способность учиться на опыте, понимать сложные концепции, рассуждать логически, адаптироваться к новым ситуациям и эффективно решать проблемы. Это основа когнитивных навыков, таких как память, решение проблем и критическое мышление.
Искусственный интеллект (ИИ): отрасль компьютерной науки, сосредоточенная на создании систем, способных выполнять задачи, которые обычно требуют человеческого интеллекта. Сюда входят такие процессы, как обучение на основе данных (машинное обучение), рассуждения для принятия решений, понимание естественного языка, распознавание шаблонов и адаптация к динамическим средам.
Машинное обучение (МО): подмножество ИИ, которое позволяет компьютерам учиться на данных и делать прогнозы или принимать решения без явного программирования. МО — это то, что сегодня поддерживает многие приложения ИИ.
Метки: выходная или целевая переменная, которую модель пытается предсказать. В контролируемом обучении метка должна быть заранее известна в обучающих данных. Например, метка для прогнозирования цены на дом будет фактической ценой дома.
Модель: результат алгоритма МО после его обучения на данных. Модель представляет изученные закономерности и используется для составления прогнозов или принятия решений на основе новых данных.
Недообучение: это обучение, когда модель слишком проста и не улавливает закономерности в данных, что приводит к плохой производительности как на данных обучения, так и на тестовых данных.
Обучение без учителя: вид машинного обучения, где модель обучается на данных без заранее известных правильных ответов. Она сама ищет закономерности и объединяет похожие данные в группы (кластеризация).
Обучение с подкреплением: вид машинного обучения, когда агент учится, пробуя разные действия в среде. За свои действия он получает либо награду, либо наказание, и со временем учится выбирать такие действия, которые приносят больше наград.
Обучение с учителем: вид машинного обучения, где модель учится на данных, где известны как входные, так и выходные значения. Цель — научить модель предсказывать правильные ответы для новых данных.
Перекрестная проверка: метод, используемый для оценки того, насколько хорошо модель будет работать на скрытых данных. Данные разделяются на несколько частей, и модель обучается и тестируется на различных комбинациях этих частей.
Переобучение: это обучение, когда модель слишком хорошо усваивает данные обучения, включая шум или случайные вариации, и плохо работает на новых данных.
Полные по Тьюрингу системы: это вычислительные системы или модели, которые обладают достаточной мощностью для выполнения любых вычислений, которые можно выразить алгоритмически, при наличии достаточного количества времени и ресурсов.
Тестовые данные: отдельный набор данных, используемый для оценки того, насколько хорошо обученная модель работает с ранее неизвестной информацией. Это гарантирует то, что модель сможет проводить обобщение и выдавать качественные результаты и за пределами обучающих данных.
Точность: мера того, как часто модель делает правильные прогнозы, обычно используется для оценки моделей классификации.
Функция потерь: функция, которая измеряет, насколько далеки прогнозы модели от фактических результатов во время обучения. Цель — минимизировать функцию потерь, чтобы повысить точность модели.
Характеристики: входные переменные или атрибуты в данных, которые модель использует для прогнозирования. Например, при прогнозировании цен на дома характеристики могут включать размер, количество комнат и местоположение дома.
Эти термины составляют основу концепций искусственного интеллекта и машинного обучения. Понимание их облегчит понимание обсуждений и применение методов машинного обучения к реальным проблемам.
Last updated