[d | au / b / bro / ci / cu / dev / hr / l / m / mi / mu / o / ph / r / s / sci / tran / tu / tv / vg / x | a / aa / c / fi / jp / rm / tan / to / ts / vn / vo]
- [Радио 410] [ii.booru-Архив РПГ] [acomics-cf-ost] [@] - [Архив - Каталог] [Главная]

[Назад]
Ответ
ke.gif - (0 KB, 25x15)  
0 KB №33040   #1

Простой наверное вопрос, для тех, кто подробно изучал теорвер, статистику и ттэ или что-то подобное. Есть набор экспериментальных точек, я хочу описать их полиномом или, скажем, суммой экспонент и тп. И вот я добавляю степень или ввожу дополнительную экспоненту, дисперсия, понятное дело, уменьшается. Есть ли критерий, который более-менее четко позволяет оценить обоснованность добавления лишней степени скажем, уменьшилась на порядок, хорошо, а всего в джва раза — недостаточное основание? Нагуглил равное, но трудно разобраться.

>> №33043   #2

Коэффициенты Стьюдента тебе в помощь.
Или я чего-то не пони и ты даже корреляцию не осилил?

>> №33045   #3

>>33043
Я ведь про нелинейность спрашиваю. Вот как во втором примере тут
https://en.wikipedia.org/wiki/Correlation_and_dependence#Correlation_and_linearity

>> №33046   #4

>>33045
Тогда вообще не понимаю, чем тебя корреляция не устраивает.
Зафигачь во второй пример интерполирующую параболу - R² скаканет до небес.
Или вопрос стоит примерно так: есть инфы на M точек, а хочется интерполировать их полиномом K степени. Или лучше K+1?

>> №33048   #5
pipe.gif - (1 KB, 46x17)  
1 KB

>>33046
Именно. Как выбрать между K и K+1. Тащемта я уже нагуглил http://udel.edu/~mcdonald/statcurvreg.html
и
http://www.r-bloggers.com/polynomial-regression-techniques/
и еще несколько. Но какой-то хендбук не помешал бы.

>> №33049   #6

>>33048

>Как выбрать между K и K+1.

Очевидно, "лучше меньше, да лучше". Ведь при K=M корреляция всегда равна 1.

>> №33051   #7

>>33049
Ну вот из этих соображений я и сформулировал оп.

>> №33052   #8

Если подходить с точки зрения экспериментальной физики, то можно попробовать оттолкнуться от среднего шумового уровня и взять условием, что при выбранном K среднее квадратичное отклонение не должно получаться лучше чем характерное для выбранного уровня шума. Но для этого шум желательно должен быть с известными и постоянными характеристиками, желательно измеренными экспериментально, ну и разумеется экспериментальных точек должно быть много. Наверняка есть статьи с нормальным разбором, но мне сейчас ничего не вспоминается.

>> №33118   #9

>>33052
По-моему это задача на чистое использование cross-validation (ну или leave 1 out если у тебя мало точек).

То, что даёт меньшую погрешность на неизвестных данных, то и будет лучше



Удалить сообщение []
Пароль
[d | au / b / bro / ci / cu / dev / hr / l / m / mi / mu / o / ph / r / s / sci / tran / tu / tv / vg / x | a / aa / c / fi / jp / rm / tan / to / ts / vn / vo]
- [Радио 410] [ii.booru-Архив РПГ] [acomics-cf-ost] [@] - [Архив - Каталог] [Главная]