Работа с таблицами. Действия. Восстановление пропусков


Для добавления данных в ячейки существующих столбцов таблицы пользуйтесь вкладкой "Действия \ Восстановление пропусков". 
На вкладке представлены различные действия по восстановлению пропущенных числовых данных в выделенных столбцах.
1. Подстановка среднего всего столбца
2. Подстановка среднего по группам (по названию)
3. Парная линейная зависимость столбцов
4. Интерполяция по ближайшим координатам X и Y
5. Логарифмическая интерполяция
6. Интерполяция как табличной функции
7. Последовательности (случайные)

1. Подстановка среднего всего столбца предполагает предварительный расчет среднего значения по столбцу, а затем заполнение этим средним пустых ячеек. Пустых ячеек при этом не должно быть больше 25 % от общего количества ячеек в столбце (от общего количества строк). Выделите столбцы в списке "Столбцы таблицы" и выполните действие. Данный метод меняет изначальное распределение значений и уменьшает его дисперсию, делая его более сконцентрированным около среднего значения. 
2. Подстановка среднего значения в группе по названию. Здесь также вместо пропусков устанавливается предварительно рассчитанное среднее, однако на каждый столбец рассчитывается несколько средних, в зависимости от количества групп, на которые поделена выборка по столбцу "Название". 
3. Парная линейная зависимость. Выбирается два столбца X и Y, между ними ищется статистическая линейная связь. Обе переменные выступают как равноправные случайные величины. Если коэффициент корреляции между столбцами не менее 0.9, то в столбцы подставляется рассчитанное по зависимости значение. Если в строке отсутствуют оба значения, то естественно оба сразу не могут быть восстановлены.
4. Интерполяция по ближайшим X и Y. Для реализации метода используются две переменные (X и Y), которые интерпретируются как область определения функции восстанавливаемой переменной. Переменная с пропусками в данном методе - это функция, непрерывно существующая для каждого X и Y (поверхность).  Для каждой точки с координатами X и Y с отсутствующим значением, проводится поиск ближайших влияющих точек и по ним рассчитывается отсутствующее значение. 
5. Логарифмическая интерполяция. Данное действие позволяет провести логарифмическую интерполяцию.
6. Интерполяция как табличной функции. Интерполяция данных как табличной функции проводится для выделенных столбцов. В интерполируемом столбце должно быть на менее двух значений. 
На видео показан пример интерполяции отсутствующих значений как табличной функции. 
7. Последовательности (случайные). Заполнение отсутствующих значений с помощью случайных последовательностей (подробнее о последовательностях). 

Кроме того, можно восстановить пропуски с помощью множественной регрессии
Если данные не подлежат восстановлению, их можно удалить

Смотрите также:
1. Таблицы. Доопределение данных (презентация)

Комментариев нет:

Отправить комментарий