Выборка или выборочная совокупность — часть генеральной совокупности элементов, которая охватывается экспериментом (наблюдением, опросом).
Характеристики выборки:
· Качественная характеристика выборки — что именно мы выбираем и какие способы построения выборки мы для этого используем.
· Количественная характеристика выборки — сколько случаев выбираем, другими словами объём выборки
http://www.sibstrin.ru/files/kis/Econometrics_Excel_part_1.pdf
стр 13
Выборка наблюдений зависимой переменной Y и объясняю- щих Xj (j = 1,2,…, k) является отправной точкой любого эконо- метрического исследования. В курсе эконометрики рассматрива- ются следующие типы выборочных (часто называемых экспери- ментальных) данных.
Пространственная выборка (или пространственные дан- ные). Предположим, что эконометрическая модель включает ве- личины Y, X1, X2, …,Xk, над которыми выполнены n наблюдений (как правило, над n-объектами). Результаты наблюдений могут быть представлены таблицей
(1.2.1)
где xij означает результат измерения j - ой переменной xj в i - ом наблюдении (эксперименте).
Такой тип данных называется пространственной выборкой или данными поперечного среза (cross-section data). Данные не имеют временного параметра, и порядок их следования в таблице (1.2.1) не существенен.
Например, данные, полученные из рекламных изданий о це- не (Y) и параметрах (X1, X2, …,Xk ) n автомобилей.
Временная выборка (или временной ряд). Временным рядом (в зарубежной литературе – time-series data) называется выборка наблюдений, в которых важен порядок следования наблюдаемых значений. Чаще всего такая упорядоченность обусловлена тем, что экспериментальные данные представляют собой серию на- блюдений одной и той же случайной величины в последователь- ные моменты времени.
Например, взяты n выпусков некоторого рекламного изде- лия, и они упорядочены по дате выпуска. Из каждого выпуска была взята цена подобного автомобиля. В этом случае мы имеем временной ряд, составленный из наблюдаемых значений y(t1), y(t2), …, y(tn), где ti – время выхода i-го выпуска рекламного изда- ния при этом ti < ti+1.
Рассмотренные типы данных в определенной степени обу- славливают типы следующих эконометрических моделей.
Чтобы получить достаточно достоверные и информативные данные о распределении какой-либо случайной величины, необ ходимо иметь выборку ее наблюдений достаточно большого объ ема. Выборка наблюдений зависимой переменной Y и объяс няющих переменных Xj (j = 1, …, p) является отправной точкой любого эконометрического исследования.
Такие выборки представляют собой наборы значений (xi1,..., xip; yi)> где i = 1,..., n; р — количество объясняющих переменных, n — число наблюдений
В эконометрических исследованиях, как правило, используются два типа выборочных данных:
1) пространственные данные (cross sectional data);
2) временные данные (time series data).
Под пространственными данными понимается совокупность экономической информации, относящейся к разным объектам, полученной за один и тот же период или момент времени. Пространственные данные представляют собой выборочную совокупность из некоторой генеральной совокупности. В качестве примера пространственных данных можно привести совокупность различной информации по какому-либо предприятию (численность работников, объем производства, размер основных фондов), об объемах потребления продукции определенного вида и т.д.
Под временными данными понимается совокупность экономической информации, характеризующей один и тот же объект, но за разные периоды времени. По аналогии с пространственной выборкой отдельно взятый временной ряд можно считать выборкой из бесконечного ряда значений показателей во времени.
В качестве примера временных данных можно привести данные о динамике индекса потребительских цен, ежедневные обменные курсы валют. Временная информация естественным образом упорядочен во времени в отличие от пространственных данных.
Существуют определенные отличия временного ряда от пространственной выборки:
1) элементы динамического ряда не являются статистически независимыми, в отличие от элементов случайной пространственной выборки, т. е. они подвержены явлению автокорреляции (зависимости между прошлыми и текущими наблюдениями временного ряда);
2) элементы динамического ряда не являются одинаково распределенными величинами.