| Максим Крамаренко ( @ 2009-05-24 22:40:00 |
Про планирование работ
Пытаюсь разобраться с мат. статистикой, нужна помощь :-) Задача такая: у нас есть план работ и оценка времени выполнения каждой задачи. Нужно узнать вероятность того, что все будет сделано к определенной дате.
Центральная предельная теорема утверждает, что сумма большого количества независимых случайных величин имеет распределение, близкое к нормальному. Т.е. если у нас проект разбит на много независимых задач и у нас есть оценки времени выполнения каждой задачи, то мы можем найти матожидание и дисперсию оценки времени выполнения проекта. Но нам-то нужно матожидание реального времени выполнения, а не матожидание оценки.
Получается, что на самом деле у нас отношение 2-х случайных величин: оценок объема работ (например, строчек кода) и оценок производительности разработчика (сколько он может выдать строчек кода такой сложности в час). Отношение 2-х нормально-распределенных случайных величин характеризуется уже не нормальным распределением, а распределением Коши, которое похоже на графике, но имеет ряд существенных особенностей:
- для распределения Коши нет математического ожидания
- дисперсия равна бесконечности (возрастает с увеличением объема выборки).
Т.е. найти матожидание и дисперсию реального времени завершения проекта получается, нельзя. Еще это значит, что центральная предельная теорема тут не применима, т.к. она относится к сл. величинам, имеющим дисперсию.
Со здравым смыслом это все вроде согласуется: оценка времени выполнения работы в плане не может быть бесконечной, в реальности разработчик может не справится с задачей вовремя, пролететь по срокам, а в итоге весь проект может быть закрыт. Также может быть ситуация, когда вроде бы простая по плану задача распадается на 20 подзадач с соответствующим увеличением сроков: случайно-низкая производительность в знаменателе для конкретной задачи приводит к резкому росту затрат времени на задачу.
А теперь вопрос - как решается эта проблема в методиках типа PERT ? Судя по тому что я читал, там просто обрабатываются оценки времени выполнения каждой подзадачи, а в итоге получается вероятность реального выполнения проекта к заданному времени. Evidence-Based Scheduling - из той же оперы.
Где ошибка ?
Пытаюсь разобраться с мат. статистикой, нужна помощь :-) Задача такая: у нас есть план работ и оценка времени выполнения каждой задачи. Нужно узнать вероятность того, что все будет сделано к определенной дате.
Центральная предельная теорема утверждает, что сумма большого количества независимых случайных величин имеет распределение, близкое к нормальному. Т.е. если у нас проект разбит на много независимых задач и у нас есть оценки времени выполнения каждой задачи, то мы можем найти матожидание и дисперсию оценки времени выполнения проекта. Но нам-то нужно матожидание реального времени выполнения, а не матожидание оценки.
Получается, что на самом деле у нас отношение 2-х случайных величин: оценок объема работ (например, строчек кода) и оценок производительности разработчика (сколько он может выдать строчек кода такой сложности в час). Отношение 2-х нормально-распределенных случайных величин характеризуется уже не нормальным распределением, а распределением Коши, которое похоже на графике, но имеет ряд существенных особенностей:
- для распределения Коши нет математического ожидания
- дисперсия равна бесконечности (возрастает с увеличением объема выборки).
Т.е. найти матожидание и дисперсию реального времени завершения проекта получается, нельзя. Еще это значит, что центральная предельная теорема тут не применима, т.к. она относится к сл. величинам, имеющим дисперсию.
Со здравым смыслом это все вроде согласуется: оценка времени выполнения работы в плане не может быть бесконечной, в реальности разработчик может не справится с задачей вовремя, пролететь по срокам, а в итоге весь проект может быть закрыт. Также может быть ситуация, когда вроде бы простая по плану задача распадается на 20 подзадач с соответствующим увеличением сроков: случайно-низкая производительность в знаменателе для конкретной задачи приводит к резкому росту затрат времени на задачу.
А теперь вопрос - как решается эта проблема в методиках типа PERT ? Судя по тому что я читал, там просто обрабатываются оценки времени выполнения каждой подзадачи, а в итоге получается вероятность реального выполнения проекта к заданному времени. Evidence-Based Scheduling - из той же оперы.
Где ошибка ?