пользователей: 30398
предметов: 12406
вопросов: 234839
Конспект-online
РЕГИСТРАЦИЯ ЭКСКУРСИЯ

2 курс 2 семестр:
» Статистика
» Эконометрика
» Социология
» ВЭД
» Экономика
2 курс 1 семестр (экономика орг):
» Экон.орг.
» псих
» менеджмент
» методы
2 семестр (математика):
» математика
2 семестр (макро):
» Экономика
I семестр:
» История

13 Принцип Беллмана.

В основе метода ДП лежит принцип оптимальности, впервые сформулированный в 1953г. американским математиком Р. Э. Беллманом.

Принцип оптимальности. Каково бы ни было состояние системы S в результате какого-либо числа i-1 шагов, на ближайшем i шаге  нужно выбирать управление так, чтобы оно в совокупности с оптимальным управлением на всех последующих шагах с (i-1)-го до n-го приводило к оптимальному выигрышу на всех оставшихся шагах, включая выигрыш на данном шаге.

При решении задачи на каждом шаге выбирается управление, которое должно привести к оптимальному выигрышу. Если считать все шаги независимыми, тогда оптимальным управлением будет то управление, которое обеспечит максимальный выигрыш именно на данном шаге. Однако, например, при покупке новой техники взамен устаревшей на ее приобретение затрачиваются определенные средства, поэтому доход от ее эксплуатации в начале может быть небольшой, а в следующие годы новая техника будет приносить больший доход. И наоборот, если принято решение оставить старую технику для получения дохода в текущем году, то в дальнейшем это приведет к значительным убыткам. Этот пример демонстрирует следующий факт: в многошаговых процессах управление на каждом конкретном шаге надо выбирать с учетом его будущих воздействий на весь процесс.

Кроме того, при выборе управления на данном шаге следует учитывать возможные варианты состояния предыдущего шага. Например, при определении количества средств, вкладываемых в предприятие в i-м году, необходимо знать, сколько средств осталось в наличии к этому году и какой доход получен в предыдущем (i–1)-м году. Таким образом, при выборе шагового управления необходимо учитывать следующие требования:

1) возможные исходы предыдущего шага S k-1

2) влияние управления -`Ok на все оставшиеся до конца процесса шаги (n-k).

В задачах динамического программирования первое требование учитывают, делая на каждом шаге условные предположения о возможных вариантах окончания предыдущего шага и проводя для каждого из вариантов условную оптимизацию. Выполнение второго требования обеспечивается тем, что в этих задачах условная оптимизация проводится от конца процесса к началу.

 


25.01.2015; 12:12
хиты: 111
рейтинг:0
для добавления комментариев необходимо авторизироваться.
  Copyright © 2013-2024. All Rights Reserved. помощь