Hurtownia danych statystycznych


OPIS STRUKTUR W ZAKRESIE SPISU ROLNEGO PSR 2002



Pobieranie 248.08 Kb.
Strona7/7
Data07.05.2016
Rozmiar248.08 Kb.
1   2   3   4   5   6   7

1.3.4.3. OPIS STRUKTUR W ZAKRESIE SPISU ROLNEGO PSR 2002



Metadane statystyczne
Klasyfikacje

Jest to zespół tabel słownikowych zawierających listy kodów, wedłlug których dokonywana jest agregacja danych ze spisu gospodarstw rolnych w Centralnej Bazie Hurtowni.

Są to tabele:

NSP_TERYT;

PSR_FORMY_WLASNOSCI;

PSR_GRUPY_PG;

PSR_GRUPY_UR;

PSR_LFA;


PSR_LFA_C;

PSR_SUMOWANIA;

PSR_TYP_GOSP_OG;

PSR_TYPO_2002 (typologia gospodarstw rolnych).


Słownik Pojęć

Tabela pełniąca rolę słownika pojęć - SPIS_TABEL_HD_OPIS zawiera listę cech (symbol cechy i nazwę) występujących w tabelach dotyczących spisów NSP 2002, PSR 2002 i RCZSR.





Szczegółowy opis tabel metadanych statystycznych znajduje się w załączniku nr 9



Baza Operacyjna
Tabele bazy operacyjnej :
OPR_PSR_2002_S1_2 powierzchni gruntów i struktura własnościowa użytków rolnych gospodarstwa

OPR_PSR_2002_S3_4 działalność gospodarcza i struktura dochodów

OPR_PSR_2002_S5 dane o osobach pracujących w gospodarstwie rolnym

OPR_PSR_2002_S5_O dane o osobach pracujących w gospodarstwie rolnym

OPR_PSR_2002_S6 powierzchnia zasiewów

OPR_PSR_2002_S7 powierzchnia inna

OPR_PSR_2002_S8 pogłowie zwierząt gospodarskich

OPR_PSR_2002_S9 rozdysponowanie produkcji rolniczej

OPR_PSR_2002_S10 infrastruktura gospodarstwa

OPR_PSR_2002_S11 budynki i budowle

OPR_PSR_2002_S12 magazynowanie w gospodarstwie

OPR_PSR_2002_S13 nawozy i pestycydy

OPR_PSR_2002_S14 maszyny i urządzenia rolnicze

OPR_PSR_2002_S15 wybrane wydatki w gospodarstwie

OPR_PSR_2002_S16 grunty wg podziału administracyjnego

OPR_PSR_2002_S17 dodatkowe cechy po symbolizacji automatycznej


Szczegółowy opis tabel dla bazy operacyjnej znajdują się w Załączniku nr 10
Poniżej znajduje się schemat tabel bazy operacyjnej



Szczegółowy opis tabel bazy operacyjnej znajduje się w załączniku nr 10


Centralna baza hurtowni

W skład bazy centralnej wchodzą tabele:

PSR_2002_DANE - dane jednostkowe w układzie kolumnowym (600 kolumn)

PSR_2002_DANE _S16 - dane jednostkowe – grunty wg podziału administracyjnego

PSR_2002_DANE _S5_O - dane o osobach pracujących w gospodarstwie rolnym

PSR_2002_AGR - tabela agregatów

PSR_2002_AGR_S16 - tabela agregatów - grunty wg podziału administracyjnego

Poniżej znajdują się schematy tabel centralnej bazy danych PSR 2002.



Szczegółowy opis tabel bazy centralnej znajduje się w załączniku nr 11



1.3.4.4. OPIS STRUKTUR W ZAKRESIE SPISU POWSZECHNEGO NSP 2002

Przy wyborze odpowiedniej struktury dla NSP2002 należało uwzględnić fakt, że :



  • potrzebnych jest wiele tabel faktów, z których każda może być powiązana z wieloma tabelami wymiarów, a wymiary te mogą być wspólne.

  • pomiędzy tabelami faktów mogą występować relacje.

Dane dotyczące spisu NSP 2002 podzielone są na następujące grupy: budynki, mieszkania, gospodarstwa domowe, rodziny i osoby.


Poniżej przedstawione są na rysunkach ogólne podstawowe schematy budowy struktur w obszarze tematycznym NSP 2002, pokazujące rozwiązania dla wielu tabel faktów: junk – rozmaitość, cechy wykorzystywane w innych gwiazdach, przeniesienie cech z góry na dół.
Rys. nr 1



Rys. nr 2


Rys. nr 3



Rys. nr 4


Rys. nr 5


Rys. nr 6




Metadane statystyczne

Metadane stanowi zespół tabel zawierających listy kodów dla cech, wg których można analizować dane:


NSP_CHARAKTER_MIEJSC, NSP_GRUPY_KRAJOW, NSP_GRUPY_WIEKU, NSP_JEZYKI, NSP_KLAS_WART, NSP_KLASA_WIELK_MIASTA, NSP_KLASYFIKACJE, NSP_KRAJE, NSP_NARODOWOSCI, NSP_PKD, NSP_PLEC, NSP_RODZ_DZIAL, NSP_TERYT, NSP_TERYT_OBW, NSP_ZAWODY, NSP_ZROD_UTRZYMANIA, OBREBY
oraz tabele tzw. junk tables zawierające wszelkie możliwe kombinacje cech wchodzących w skład danego junk-u. Tabele te mają na celu uproszczenie konstruowania raportów.
NSP_CECHY_BUDYNKU, NSP_CECHY_GLOWY_GOSP, NSP_CECHY_GLOWY_RODZ, NSP_CECHY_GOSP_NAROD, NSP_CECHY_GOSP_ROLN, NSP_CECHY_GOSP_SPRAWN, NSP_CECHY_GOSP_ZAGR, NSP_CECHY_GOSP_ZROD_UTRZ, NSP_CECHY_GOSPODARSTWA, NSP_CECHY_MIESZK_CHAR, NSP_CECHY_MIESZK_INFO, NSP_CECHY_MIESZK_WYPOSAZENIE, NSP_CECHY_RODZ_SPRAWN, NSP_CECHY_RODZ_ZAGR, NSP_CECHY_RODZINY, NSP_CHARAKTER_MIEJSC,
Poniżej znajdują się schematy tabel metadanych statystycznych





Szczegółowy opis tabel metadanych statystycznych znajduje się w załączniku nr 13
Baza Operacyjna
Tabele bazy operacyjnej dla danych spisowych NSP 2002:
OPR_NSP_2002_BUD - zawiera dane dotyczące budynków

OPR_NSP_2002_CZAS - zawiera dane dotyczące osób czasowo przebywających

OPR_NSP_2002_GOS - zawiera dane dotyczące gospodarstw domowych

OPR_NSP_2002_IMIG - zawiera dane dotyczące imigrantów

OPR_NSP_2002_LUD - zawiera dane dotyczące osób

OPR_NSP_2002_ROD - zawiera dane dotyczące rodzin

OPR_NSP_2002_ZAM - zawiera dane dotyczące zamieszkania

Poniżej znajdują się schematy tabel bazy operacyjnej NSP2002.



Szczegółowy opis tabel bazy operacyjnej znajduje się w załączniku nr 14


Baza Centralna
Tabele bazy centralnej dla spisowych danych jednostkowych NSP 2002 stanowią następujące tabele faktów:
NSP_BUDYNKI;

NSP_MIESZKANIA;

NSP_GOSPODARSTWA;

NSP_RODZINY, NSP_OSOBY;

NSP_OSOBY_CZAS;

NSP_MIGRACJE_2002;

NSP_IMIGRANCI;

NSP_OSOBY.


Spośród tych tabel NSP_BUDYNKI i NSP_MIESZKANIA są ze sobą powiązane kluczem obcym, NSP_OSOBY są powiązane z NSP_RODZINY poprzez kolumnę nie będącą kluczem obcym. Można również uzyskać powiązania pozostałych tabel faktów w miarę potrzeb.
Poniżej znajdują się schematy tabel bazy centralnej NSP 2002
Tabela NSP_BUDYNKI z powiązaniami




Tabela NSP_MIESZKANIA z powiązaniami



Tabela NSP_GOSPODARSTWA z powiązaniami



Tabela NSP_RODZINY z powiązaniami



Tabela NSP_OSOBY z powiązaniami.


Tabela NSP_OSOBY_CZAS z powiązaniami

Tabela NSP_MIGRACJE_2002 z powiązaniami



Tabela NSP_IMIGRANCI z powiązaniami

Szczegółowy opis tabel bazy centralnej znajduje się w załączniku nr 15



1.3.5. WYKORZYSTYWANE NARZĘDZIA W HDS

Architektura systemowa HDS opiera się na wykorzystaniu technologii Oracle oraz komponentów pozwalających na uzyskanie funkcjonalności związanych z udostępnianiem danych.

Rysunek 7 przedstawia diagram prezentujący architekturę systemową HDS.


Rysunek 7 Architektura systemowa HDS

Wykorzystanie komponentów technologii Oracle przez poszczególne moduły:



  • Moduł zasilania bazy - jest to zbiór procedur PL/SQL, które pobierają i przetwarzają dane z plików lub zewnętrznych baz danych. Proces ładowania jest sterowany i nadzorowany poprzez specjalny pakiet procedur PL/SQL. Mechanizm pozwala na definiowanie procesu importu danych poprzez metadane konfiguracyjne.

  • Baza operacyjna, Centralna Baza Danych, obszar analityczny oraz moduł metadanych zaimplementowane zostały w relacyjnej bazie danych Oracle 10g w wersji Enterprise.

  • Moduł udostępniania danych, raportów i analiz składa się z następujących komponentów:

    • Oracle Discoverer, w którym definiowane są raporty;

    • Serwera aplikacyjnego Oracle Application Server (OAS), poprzez który raporty są udostępniane użytkownikom posiadającym przeglądarkę internetową;

  • Oracle BI Suite Enterprise Edition, systemu umożliwiającego tworzenie wielu różnorodnych dokumentów i raportów, sprawozdań i analiz ad hoc. System ten został wdrożony pilotażowo na danych finansowych z formularza F-01.

Alternatywną ścieżką dostępu do HDS jest dostęp z poziomu aplikacji Oracle Reports, za pomocą której użytkownicy mogą łączyć się bezpośrednio ze swoich komputerów.

  • Oracle Warehouse Builder (OWB) to narzędzie, dzięki któremu można zaprojektować hurtownię danych, a następnie zarządzać jej pracą. W technologii tej została zbudowana pilotażowa hurtownia HINEX.

  • QUEST TOAD zaawansowane narzędzie firmy QUEST stosowany jest do zarządzania bazą danych i optymalizacji przetwarzania.

Załącznik

Opis składni zbioru Mdane
::=

















ENDSPEC


        1. ::=

SURVEY =

::= tekst

        1. ::=









::=

INPUT =



::= tekst

::=

HEADER =



::= liczba

::=

RECORD =



::= liczba

::=

FIELDS


ENDFIELDS



::=

|

[]



::=

, ,
, [,]


::= tekst

::= C | N | L | ...

gdzie:

C – pole znakowe

N – pole numeryczne

L – pole logiczne


::= liczba


::= liczba

::= liczba

        1. ::=

ID =

::=

|
[,]



::=


::= tekst


        1. ::=

RR_SURVEY =

MM_SURVEY =

TYPE_SURVEY =


::= dwie cyfry roku okresu sprawozdawczego |

::= dwie cyfry miesiąca roku sprawozdawczego

::= m | k | p | r | ...

gdzie:

m – częstotliwość badania miesięczna

k – częstotliwość badania kwartalna

p – częstotliwość badania półroczna

r – częstotliwość badania roczna


        1. ::= puste |

INDICATORS

ENDINDICATORS



::=

|

[]



::=

=

::=

|

|

|



::= + | - | * | / | ...

::= liczba

::= MM_SURVEY | ...


        1. ::=

METADATA

ENDDATA


::=

|

[]



::=

, ,
, ,


,



::= tekst

::= liczba


::=

::= 1 | 1.. | 2 | 2.. | 3 | 3.. | 4 | 5...

gdzie:


1 – dane za jeden miesiąc, kwartał lub półrocze

2 – dane od początki roku do końca okresu sprawozdawczego

3 – dane wg stanu na ostatni dzień okresu sprawozdawczego

4 – stan na dzień 01.01 roku sprawozdawczego

5 – dane na określony dzień (inny niż ostatni dzień okresu sprawozdawczego);

odpowiednio: rok, miesiąc i dzień określający stan obserwacji | zawierającego odpowiednio: rok, miesiąc i dzień określający stan obserwacji

::= | 1 | 2 | 3 | 4 | 4a | 4b | 5 | 5a | 5b ...

gdzie:


1 – dane jednostkowe: wartość ze sprawozdania sporządzonego przez jednostkę lub z administracyjnego źródła danych

2 – dane jednostkowe: wartość imputowana na podstawie innych danych jednostki;

3 – dane jednostkowe: wartość imputowana na podstawie danych innych jednostek;

4 - dane zagregowane: agregat zawierający sumę (danych) jednostek, które wystąpiły w badaniu (łącznie z danymi imputowanymi dla poszczególnych jednostek)

4a – dane zagregowane: udział danych imputowanych w agregacie

4a = (1 – dane dla jednostek o =1 / dane dla agregatu) * 100,0

4b - dane zagregowane: udział danych imputowanych na podstawie danych innych jednostek w agregacie

4b = (1 - dane dla jednostek o =1_lub_2 / dane dla agregatu) * 100,0

5 - dane zagregowane: agregat zawierający dane uogólnione

5a – dane zagregowane: uogólnienia na podstawie liczby pracujących

5b – dane zagregowane: uogólnienia na podstawie wag


        1. ::=

DATE_DATA =

::= data

Uwagi:

  • Lista pól identyfikujących dane źródłowe może zawierać więcej niż jeden element. Zazwyczaj występuje jeden – którym jest REGON lub pole zawierające kod agregatu dla wczytywanych danych zagregowanych, jednak w przypadku danych spisowych (lub badań społecznych, które nie są objęte pilotażem), identyfikacja danych będzie bardziej złożona, np. poprzez: województwo + nr_obwodu_spisowego + nr_gospodarstwa. W takich przypadkach proponujemy umieścić w pliku opisu danych rekord:

ID = WO, NR_OBW, NR_GOSP

przy założeniu, że w pliku danych źródłowych województwo zapisane jest w polu WO, nr obwodu spisowego – w polu NR_OBW, a nr gospodarstwa – w polu NR_GOSP.



  • kod agregatu – dla danych zagregowanych

Każdy agregat jest opisany symbolem i poziomem klasyfikacji (Założenia wstępne WBO), wg schematu: KL.poz,

gdzie


kl oznacza nazwę skróconą klasyfikacji (listy)

poz – symbol formalny pozycji danej listy

np. PKD.1583, PKD.4521, WO.32

W przypadku, gdy agregat jest bardziej złożony (jest kombinacją kilku klasyfikacji), proponuje się zapis: klx.pozy*klm.pozn*klp.pozq

np. WO.20*PKD.453*FWB.1 oznacza sektor publiczny (FWB.1) w grupie PKD 453 (wykonywanie instalacji budowlanych) dla województwa podlaskiego (WO.20)

- z możliwością użycia operatora „+” na poziomie pozycji (klx.(pozy+pozq)*klm.pozn)




Projekt współfinansowany przez UNIĘ EUROPEJSKĄ z Europejskiego Funduszu Rozwoju Regionalnego oraz ze środków budżetu państwa.7 Oś Priorytetowa: Społeczeństwo informacyjne – budowa elektronicznej administracji

str.



1   2   3   4   5   6   7


©absta.pl 2019
wyślij wiadomość

    Strona główna