Награды быстро приедаются, поэтому важно делать их разнообразными, сначала награждать за малые шаги, а затем повышать планку и награждать уже только за крупные. С течением времени оптимально переходить к вариативному подкреплению, когда вероятность награды снижается от 50 до 25 %.