Hurtownia danych statystycznych


OPIS STRUKTUR W ZAKRESIE SPISÓW ROLNYCH R-CZSR, R-SGR



Pobieranie 248.08 Kb.
Strona6/7
Data07.05.2016
Rozmiar248.08 Kb.
1   2   3   4   5   6   7

1.3.4.2. OPIS STRUKTUR W ZAKRESIE SPISÓW ROLNYCH R-CZSR, R-SGR

W ramach obecnej HDS zgromadzone i zintegrowane są dane zarówno z PSR 2002, jak i kolejnych spisów rolnych prowadzonych na mniejszej zbiorowości gospodarstw rolnych (R-CzSR za lata 2006 i 2007, R-SGR za lata 2007 i 2008).


Metadane statystyczne
Statystyczny Rejestr Gospodarstw Rolnych i Leśnych (SRGRiL)

W hurtowni danych jest utworzony moduł Statystyczny Rejestr Gospodarstw Rolnych i Leśnych (odpowiednik BJS dla jednostek gospodarczych). Dane do tego rejestru są wczytywane z pliku tekstowego

W skład modułu SRGR wchodzą następujące tabele:


  • SRGR;

  • SRGR_HIST;

  • SRGR_NR_GOS.

Tabela SRGR zawiera bieżący stan danych jednostkowych o gospodarstwach rolnych i leśnych. Tabela ta uzupełniana jest o identyfikatory nadawane przez HD i pola opisowe poszczególnych kolumn.

W hurtowni danych utworzona została również tabela SRGR_HIST analogicznie jak w przypadku BJS_HIST „gospodarczego”.
Identyfikację jednostek rolniczych z tabeli SRGR wspomaga tabela SRGR_NR_GOS posiadająca następujące pola:


  • ID_PSR – identyfikator systemowy HD dla danych PSR jako wskazanie na jednostkę (gospodarstwo) ze spisu PSR 2002;

  • NR_GOS – unikalny numer gospodarstwa;

  • ID_SRGR - identyfikator Statystycznego Rejestru Gospodarstw Rolnych (utworzonego w zewnętrznym systemie GUS);

  • DATA_AKTUALIZACJI – data aktualizacji danych.


Klasyfikacje
Jest to zbiór tabel słownikowych zawierających klasyfikacje, które są wymiarami dla danych jednostkowych w Centralnej Bazie Hurtowni

Są to tabele związane z danymi formularza R-CzSR:

TERYT, SRGR_KLASYFIKACJE (klasyfikacje dla gospodarstw rolnych),

SRGR_KLAS_WART (wartości dla klasyfikacji dla gospodarstw rolnych),

TYPO_RCZSR2005, RSGR_2007_TYPO (typologia gospodarstw rolnych - klasyfikacja gospodarstw rolnych według zasad obowiązujących w Uniii Europejskiej).
Słownik pojęć
Tabele zawierające dane o statystycznych pojęciach rolnych (tabela POJECIA_ROLNE) stanowiących podstawowe kryterium analizy danych. Pojęcia są grupowane tworząc dziedziny i listy. zawarte w tabeli DZIEDZINY_ROLNE i LISTY_ROLNE. W tabelach DZIEDZINY_POJECIA_ROLNE i LISTY_POJECIA_ROLNE zawarta jest hierarchia pojęć.

Struktura metadanych
Poniżej znajdują się schematy tabel metadanych

Metadane statystyczne – SRGRiL (Statystyczny Rejestr Gospodarstw Rolnych i Leśnych)



Słownik pojęć (dla statystyki rolnej)



Klasyfikacje




MDANE
Jest to zespół tablic, w których znajduje się opis powiązań danych z metadanymi.,

Schemat powiązań między tabelami znajduje się w części dotyczącej statystyki gospodarczej.


Opis składni zbioru Mdane i zawartość plików Mdanych dla formularzy R-CzSR jest w załączniku 3.

Baza Operacyjna
W bazie operacyjnej dokonywane są następujące operacje:

Zasilanie danych

Struktury tabel bazy operacyjnej odpowiadają strukturom plików tekstowych zasilających hurtownię danych uzupełnione o dodatkowe pola niezbędne do obsłużenia procesu wczytywania danych oraz pola wymagane do obsłużenia funkcjonalności uogólniania danych.


Uogólnianie danych

W hurtowni danych jest wykonywana procedura uogólniania danych. Uogólnianie polega na mnożeniu wczytanych wartości jednostkowych przez odpowiednie mnożniki (wagi). Pliki Mdane zawierają algorytm uogólniania. Każda pozycja z formularzy podlegająca uogólnieniu będzie posiadać wskazanie, którym mnożnikiem (wagą) ma być uogólniana. Informacje o algorytmie uogólniania będą przechowywane w tabeli ZRODLA_POZYCJE.


Integracja danych formularzowych z danymi PSR 2002.

W ramach integracji danych formularzowych dotyczących rolnictwa z danymi z PSR 2002 roku, tabela faktów bazy centralnej PSR_DANE_FORM zawierająca dane jednostkowe z formularzy rolniczych jest uzupełniana danymi PSR z tabeli PSR_2002_DANE. W ramach tego procesu odbywa się transformacja danych PSR z układu kolumnowego do układu wierszowego tabeli PSR_DANE_FORM. Transformacja danych pomiędzy tymi dwiema tabelami bazy centralnej się realizowana jest w oparciu o „mdane” zawarte w tabeli ZRODLA_POZYCJE.

Tabela POJECIA_ROLNE została uzupełniona o zestaw pojęć tak, aby można było analizować dane w tablicy PSR_DANE_FORM.

Tabela PSR_DANE_FORM jest uzupełniana danymi z PSR2002 z datą przeprowadzenia spisu PSR2002 oraz z identyfikatorem formularzowym PSR.


Typologia gospodarstw rolnych

W HDS dokonuje się obliczenia klasyfikacji gospodarstw rolnych według zasad obowiązujących w Uniii Europejskiej czyli tzw. typologii gospodarstw rolnych.



Tabele metabazy operacyjnej:

OPR_MB_SRGR, OPR_MB_POJECIA_ROLNE, OPR_MB_POJ_DZIEDZ_ROLNE, OPR_MB_DZIEDZINY_ROLNE, OPR_MB_LISTY_ROLNE, OPR_MB_LISTY_POJECIA_ROLNE

Szczegółowy opis tabel bazy metabazy operacyjnej znajduje się w załączniku nr 6.

Poniżej znajdują się schematy tabel metadanych

.



Tabele z danymi jednostkowymi:


OPR_FRM_RCZSR_A

- tabela operacyjna zawierająca dane za rok 2005, 2006 i 2007 – część 1

OPR_FRM_RCZSR_B

- tabela operacyjna zawierająca dane za rok 2005, 2006 i 2007 – część 2

OPR_FRM_RCZSR

- tabela operacyjna zawierająca dane za rok 2005, 2006 i 2007 (połączone części 1 i 2 561 kolumn)

OPR_FRM_RCZSR_UOG

- tabela operacyjna zawierająca dane uogólnione (dla lat od 2002 roku), tzn dane z tabeli OPR_FRM_RCZSR przemnożone przez mnożniki dostarczone przez Departament (485 kolumn)

OPR_RCZSR_OS_NAJ

- tabela operacyjna zawierająca dane o osobach z rodziny pracujących w gospodarstwie rolnym – rok 2005 i 2007

OPR_RCZSR_OS_RODZ

- tabela operacyjna zawierająca dane o osobach najemnych pracujących w gospodarstwie rolnym - rok 2005 i 2007

OPR_RCZSR_OSOBY

- tabela operacyjna wspólna dla osób pracujących w gspodarstwie rolnym – rok 2007




Szczegółowy opis tabel dla bazy operacyjnej znajdują się w Załączniku nr 7
Centralna baza hurtowni
Dane do struktur centralnej bazy hurtowni pochodzą z bazy operacyjnej. Na podstawie przygotowanych algorytmów transformacji dane z bazy operacyjnej są przeniesione do struktur docelowych z zachowaniem reguł spójności i integralności (spełnienia nałożonych więzów integralnych). Reguły transformacji i nałożone więzy sprawdzają powiązanie poszczególnych pól we wczytywanych formularzach ze słownikami, pojęciami i klasyfikacjami metadanych statystycznych.
Bazę centralną hurtowni danych w zakresie formularzy statystyki rolnej stanowią formularzowe dane jednostkowe i dane uogólnione.
Tabele bazy centralnej:
RCZSR_OS_NAJ - tabela zawierająca dane o osobach najemnych pracujących w gospodarstwie rolnym w układzie kolumnowym - rok 2005 i 2007;

RCZSR_OS_RODZ - tabela zawierająca dane o osobach z rodziny użytkownika gospodarstwa w układzie kolumnowym - rok 2005 i 2007;

RCZSR_OSOBY - tabela zawierająca dane o osobach związanych z gospodarstwem;

RCZSR_A_2007 - tabela zawierająca dane w układzie kolumnowym z działów I – V za rok 2007;

RCZSR_B_2007 - tabela zawierająca dane w układzie kolumnowym z działów VI – X za rok 2007;

RCZSR_2007_DANE - tabela zawierająca dane za 2007 rok w układzie kolumnowym - całość;

RCZSR_INTE_PSR_2002 - tabela zawierająca numery gospodarstw, które są badane w bieżącym roku, a nie były badane w latach poprzednich;

RCZSR_ZMIENNE_2007 - tabela zawierająca listę zmiennych badanych w 2007 roku skojarzonych z pojęciami;

PSR_DANE_FORM - tabela bazy centralnej badań cyklicznych i sprawozdań rolnych - dane jednostkowe – układ gwiazdy;

EUROSTAT_RCZSR - tabela zawierająca dane przekazywane w pliku do

EUROSTAT;

EUROSTAT_CONFIG - tabela zawierająca metadane do generowania pliku dla

EUROSTAT.
Formularzowe dane jednostkowe w układzie gwiazdy

Dane jednostkowe z formularzy jednostkowych dotyczących badań rolniczych w bazie centralnej przechowywane są w tabeli faktów PSR_DANE_FORM połączonej kluczami obcymi z następującymi tabelami wymiarów:


- Pojęcia rolne;

- Statystyczny Rejestr Gospodarstw Rolnych i Leśnych;

- Formularze;

- Czas.





Formularzowe dane w układzie kolumnowym W bazie centralnej znajduje się zestaw tabel zawierających dane przekształcone z układu wierszowego (struktura gwiazdy) do układu kolumnowego. W poszczególnych kolumnach znajdują się wartości dla pojęć, natomiast jeden wiersz dotyczy jednostki statystycznej




Formularzowe dane w układzie kolumnowym dotyczące osób

Dane z formularza R-CZSR dotyczące osób (osoby w rodzinie i najemcy) z plików tekstowych docelowo trafiają do dwóch tabel w układzie kolumnowym odpowiadającym strukturze pliku. Tabele te są rozszerzone o pole DATA_DANYCH. Na podstawie tych dwóch tabel została wygenerowana tabela RCZSR_OSOBY zawierająca pola wg różnych formuł. Na podstawie tej tabeli oraz tabeli PSR_DANE_FORM sa generowane dane do tabeli EUROSTAT_RCZSR w oparciu o metadane zapisane w tabeli EUROSTAT_CONFIG służące do generowania pliku dla Eurostatu. W tabeli EUROSTAT_CONFIG zapisana jest kolejność poszczególnych pól w pliku , ich format oraz algorytm generowania danych.


W HDS na potrzeby komunikacji z innymi systemami zewnętrznymi (BDR i Eurostat) utworzone są specjalne struktury danych, które mogą być wykorzystywane w sposób bezpośredni (DBLink), bądź pośredni (pliki zewnętrzne).
Szczegółowy opis tabel dla bazy centralnej znajdują się w Załączniku nr 8

Poniżej znajdują się schematy tabel









1   2   3   4   5   6   7


©absta.pl 2019
wyślij wiadomość

    Strona główna