Максим Крамаренко (maximkr) wrote,
Максим Крамаренко
maximkr

Category:

Про планирование работ

Пытаюсь разобраться с мат. статистикой, нужна помощь :-) Задача такая: у нас есть план работ и оценка времени выполнения каждой задачи. Нужно узнать вероятность того, что все будет сделано к определенной дате.

Центральная предельная теорема утверждает, что сумма большого количества независимых случайных величин имеет распределение, близкое к нормальному. Т.е. если у нас проект разбит на много независимых задач и у нас есть оценки времени выполнения каждой задачи, то мы можем найти матожидание и дисперсию оценки времени выполнения проекта. Но нам-то нужно матожидание реального времени выполнения, а не матожидание оценки.

Получается, что на самом деле у нас отношение 2-х случайных величин: оценок объема работ (например, строчек кода) и оценок производительности разработчика (сколько он может выдать строчек кода такой сложности в час). Отношение 2-х нормально-распределенных случайных величин характеризуется уже не нормальным распределением, а распределением Коши, которое похоже на графике, но имеет ряд существенных особенностей:
- для распределения Коши нет математического ожидания
- дисперсия равна бесконечности (возрастает с увеличением объема выборки).

Т.е. найти матожидание и дисперсию реального времени завершения проекта получается, нельзя. Еще это значит, что центральная предельная теорема тут не применима, т.к. она относится к сл. величинам, имеющим дисперсию.

Со здравым смыслом это все вроде согласуется: оценка времени выполнения работы в плане не может быть бесконечной, в реальности разработчик может не справится с задачей вовремя, пролететь по срокам, а в итоге весь проект может быть закрыт. Также может быть ситуация, когда вроде бы простая по плану задача распадается на 20 подзадач с соответствующим увеличением сроков: случайно-низкая производительность в знаменателе для конкретной задачи приводит к резкому росту затрат времени на задачу.

А теперь вопрос - как решается эта проблема в методиках типа PERT ? Судя по тому что я читал, там просто обрабатываются оценки времени выполнения каждой подзадачи, а в итоге получается вероятность реального выполнения проекта к заданному времени. Evidence-Based Scheduling - из той же оперы.

Где ошибка ?
 
Subscribe

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 9 comments