Если коротко, то внутри системы базальных ганглиев встроено что-то вроде шкатулки с предсказаниями: когда мы решаем выбрать определенный вариант поведения, внутрь этого варианта уже вшит прогноз – то, что мы ожидаем получить в результате своих действий. Этот прогноз затем можно сравнить с тем, что вышло на самом деле, и по итогам этого сравнения дофаминовая система выступает чем-то вроде жюри, выставляя оценку тому, что получено, по сравнению с тем, что ожидали получить. Если получилось лучше, чем ожидалось, дофамина выделится много: скорее всего, мы возьмем удачное решение на заметку и попробуем использовать его чаще. Если получилось хуже, чем хотелось, появится дофаминовый провал: тогда мы будем пробовать другие варианты действий или вообще постараемся избегать ситуаций, которые оборачиваются неприятностями [16]. Таким образом, успешные действия постепенно закрепляются, а неудачные варианты отбрасываются – этот процесс на языке алгоритмов называется обучением с подкреплением [13]. При этом базальные ганглии обновляют не только программы действий, но и прогнозы, чтобы они лучше соответствовали действительности.