I. Wiadomości I pojęcia wstępne I informacja I kodowanie



Pobieranie 250.76 Kb.
Strona1/12
Data08.05.2016
Rozmiar250.76 Kb.
  1   2   3   4   5   6   7   8   9   ...   12

I. Wiadomości i pojęcia wstępne

I.1. Informacja i kodowanie


Informacja jest to „coś” co pozwala odróżniać obiekty lub cechy obiektów i jest przekazywalne innym osobom (obiektom).

Najprostszym rozróżnieniem (jednostką informacji) jest rozróżnienie między dwoma obiektami lub cechami. Taka informacja nosi nazwę bit informacji.

Do przekazywania informacji w formie zapisu potrzebne jest narzędzie – kod umożliwiający zapis za pomocą umownych symboli - znaków. Najprostszym kodem operującym tylko dwoma symbolami jest kod binarny ( np. zerojedynkowy) w którym każdy znak niesie jeden bit informacji. Wszystkie bardziej skomplikowane kody można na niego przetłumaczyć. Zapis dokonywany jest zawsze na pewnym nośniku, którym może być tradycyjny papier ale także światło, dźwięk, taśma magnetyczna lub inny obiekt materialny lub zjawisko fizyczne.

W zbiorze kodów istnieje szczególna klasa kodów, wymagających minimalnej liczby bitów do zapisania danej informacji. Na ogół informacja zakodowana jest większą niż ta niezbędna minimalna liczba bitów. Ta własność to redundancja zapisu. Spełnia ona ważną rolę w procesie przekazywania informacji, do czego wrócimy w dalszej części wykładu..

Przez dane rozumiemy tu wszelkie informacje zapisane w formie zakodowanej (binarnie, szesnastkowo, kreskowo, kolorystycznie etc.). Odróżniamy dane wyjściowe i dane przetworzone.
I.2. Procesy przetwarzania danych

Pojęcie przetwarzania danych obejmuje różnorodne operacje na danych wyjściowych, których wspólną cechą jest to, że w ich toku nie powstają nowe informacje, nie zawarte przynajmniej implicite w danych wyjściowych; przeciwnie – informacje mogą (choć nie zawsze muszą) być w nich tracone; natomiast często zmienia się forma ich zapisu. Do informacji może najwyżej dojść opis procedur stosowanych w procesie ich uzyskiwania i przetwarzania, tzw. metadane (ang. metadata) . Dane przetworzone często reprezentują explicite pewne informacje zawarte implicite w danych wyjściowych. Różnych procedur przetwarzania danych jest bardzo wiele i ciągle pojawiają się nowe. Do typowych zaliczyć można, selekcję (rezygnację z części danych wyjściowych), uogólnianie (tj. rezygnację z niepotrzebnych rozróżnień np. przez tworzenie hierarchii taksonomicznych, lub uśrednianie zbiorów danych liczbowych), zmianę kodu (np. przejście od ciągu cyfr do reprezentacji graficznej), zmianę nośnika, archiwizację (tworzenie bazy danych) itp. Przetwarzaniu danych często towarzyszy ich transmisja do innego urządzenia lub innego użytkownika. Wynikiem ciągu operacji tworzących proces przetwarzania jest zbiór danych końcowych, które trafiają do użytkownika celem bezpośredniego wykorzystania. Procedury wydobywania z wyjściowego zbioru danych istotnie potrzebnych z punktu widzenia prowadzonego procesu przetwarzania noszą ogólną nazwę filtracji. Należy jednak pamiętać, że termin filtracja, (podobnie jak filtr), jest bardzo wieloznaczny i nawet w tym wykładzie spotkamy się z jeszcze innymi jego znaczeniami.

Archiwizowanie i transmisja a także niektóre inne procedury łączą się z kosztami rosnącymi wraz z rozmiarami zapisu. Dla ich zmniejszenia stosuje się rozmaite formy kompresji tj. zmianę kodu na mniej redundantny. Typowym przykładem kompresji jest zapisywanie tylko różnic pomiędzy kolejnymi wyrazami ciągów liczbowych, zamiast ich pełnych wartości (jeżeli różnice te są małe w porównaniu z samymi wyrazami).

I.3. Metody matematyczne w przetwarzaniu danych


Praktyczne metody przetwarzania danych są zawsze operacjami realizowanymi na skończonych zbiorach danych w skończonej liczbie dyskretnych kroków. W rozważaniach teoretycznych często jest jednak wygodniej operować aparatem pojęciowym analizy matematycznej, w której istotną rolę odgrywają działania nieskończone i pojęcie ciągłości i dopiero do tak wypracowanych koncepcji dobierać odpowiednie skończone, dyskretne aproksymacje numeryczne.

W dalszym ciągu tego wykładu często stosować będziemy w rozważaniach teoretycznych aparat analizy matematycznej (klasycznej i funkcjonalnej), zakładając, że wszystkie potrzebne operacje, takie jak różniczkowanie lub całkowanie (w szczególności wyznaczanie transformaty Fouriera i innych transformat całkowych), są wykonalne, w razie potrzeby odwołując się do teorii dystrybucji. Sprawą „przetłumaczenia” tak uzyskanych wyników na język skończonych operacji numerycznych zajmować się będziemy jedynie okazjonalnie.


I.4. Analiza


Potencjalnie często mamy do dyspozycji ogromne ilości danych, ilości którymi nie są w stanie operować posiadane przez nas komputery. W dodatku końcowym użytkownikiem danych jest z reguły człowiek, którego umysł nie jest w stanie operować więcej niż kilkoma informacjami naraz. Jednym z głównych celów przetwarzanie jest na ogół redukcja zbioru danych wyjściowych tak, by zbiór danych końcowych zawierał jedynie informacje rzeczywiście niezbędne dla użytkownika i w formie wygodnej dla ich wykorzystania. Twego rodzaju proces przetwarzania nazywamy analizą danych. W toku analizy dokonuje się zwykle różnego rodzaju selekcji i uogólnień a także zmian kodu (formatu) zapisu na bardziej dogodny (np. zmiany zapisu cyfrowego na reprezentacje graficzną).

Dane wyjściowe mogą zawierać błędy, ponadto w toku przetwarzania dane mogą być gubione celowo lub niechcący (to ostatnie następuje zwłaszcza przy zmianie kodów i nośników, lub w wyniku zakłóceń na liniach telekomunikacyjnych) a także zniekształcane. Elementem procesu analizy danych musi więc być detekcja błędów na poszczególnych etapach. Jeśli utracona lub zniekształcona informacja jest zapisana w kodzie redundantnym, to jest szansa, że ocalały fragment kodu zawiera jej powtórzenie lub ilość informacji wystarczającą do odtworzenia utraconych lub zniekształconych danych tzn. ich  korekcję.

Po przeprowadzeniu odpowiedniej filtracji stanowiącej rdzeń procesu analizy, winien się on zamykać syntezą zbioru danych końcowych, który następnie podlega edycji i wizualizacji celem przedstawienia ich w formie dogodnej dla użytkownika. Edycja polega na decydowaniu, w jakim kodzie i formacie dane końcowe zostają udostępnione użytkownikowi. Wizualizacja jest graficzną formą edycji (wykresem, histogramem, przekrojem, mapą, pseudo-trójwymiarowym obrazem etc.).

Edycja i wizualizacja powinny brać pod uwagę psychologię użytkownika (ważne zwłaszcza gdy użytkownik musi podstawie tych danych podejmować szybko subiektywne decyzje – np. meteorolog lotniskowy). Nie ma niestety uniwersalnej recepty na to, jak te ostatnie etapy analizy powinny być przeprowadzone.





  1   2   3   4   5   6   7   8   9   ...   12


©absta.pl 2019
wyślij wiadomość

    Strona główna