Sop_04_lab.pdf

Laboratorium systemów operacyjnych – ćwiczenie nr 4.

[ilość modułów: 1]

Temat zajęć: Filtry, strumienie standardowe oraz przetwarzanie potokowe

Czas realizacji zajęć: 180 min.

Zakres materiału, jaki zostanie

zrealizowany podczas zajęć:

Strumienie standardowe i ich przekierowywanie, podstawowe filtry,

przetwarzanie potokowe z zastosowaniem filtrów.

I. Standardowe wejście/wyjście

Każdy proces domyślnie korzysta ze standardowych strumieni danych, będących abstrakcją źródła

lub ujścia danych. Dla każdego procesu system tworzy standardowy strumień wejściowy (ang.

standard input ), reprezentujący urządzenia wejściowe, np. klawiaturę i dysk, standardowy strumień

wyjściowy (ang. standard output ), którym może być terminal (monitor komputera) lub plik oraz

strumień diagnostyczny (ang. standard error ). Strumienie wejściowy, wyjściowy i diagnostyczny

oznaczane są odpowiednio: stdin , stdout , stderr. Każdy strumień ma odpowiadające mu

wartości: stdin – 0, stdout – 1 i stderr – 2.

stdout

stdin

Proces

stderr

Rysunek 1: Standardowe wejście/wyjście procesu

Standardowe strumienie procesów charakteryzują się następującymi cechami:

1. Dane odczytywane są poprzez standardowe wejście.

2. Dane wypisywane są na standardowym wyjściu lub standardowym wejściu diagnostycznym.

3. Raz przeczytanych danych nie można ponownie przeczytać.

Działanie standardowych strumieni ilustruje program cat. Uruchomienie tego programu bez

argumentów powoduje przepisanie tego, co zostanie wpisane z klawiatury na ekran. Polecenie to

można zakończyć za pomocą kombinacji Ctrl-D.

II. Przekierowanie wejścia/wyjścia procesów

Istnieje możliwość przeadresowania strumieni wyjściowych i wejściowych. Zmianę standardowego

wejścia, wyjścia i wyjścia diagnostycznego można dokonać za pomocą operatorów: >, <, >>, <<.

Operator > powoduje przeadresowanie standardowego wyjścia, czyli utworzenie pliku i zapisanie w

nim tego, co proces wypisałby na standardowym wyjściu. Jeśli wskazany plik już istnieje, zostanie on

usunięty i utworzony na nowo.

%cat > plik.txt

To jest plik.

str. nr 1 /7

Laboratorium systemów operacyjnych – ćwiczenie nr 4.

[ilość modułów: 1]

Ala ma kota.

Operator < powoduje przeadresowanie standardowego wejścia procesu, czyli pobranie danych

wejściowych ze wskazanego pliku:

%cat < plik.txt

To jest plik.

Ala ma kota.

Operatory > i < można używać jednocześnie, przeadresowując zarówno wyjście jak i wejście, co

spowoduje, że zawartość pliku plik.txt zostaje skopiowana do pliku plik_nowy.txt:

%cat < plik.txt > plik_nowy.txt

Operator >> przeadresowuje standardowe wyjście, dopisując wyniki działania programu na końcu

istniejącego pliku:

%cat >> plik.txt

Kot ma Ale.

Operator << powoduje, że do procesu zostaną przekazane dane ze standardowego wejścia aż do

napotkania wskazanego napisu:

%cat << przerwa

> Ala ma kota

> Kot ma Ale

> przerwa

Ala ma kota

Kot ma Ale.

Niektóre polecenia równolegle z wyświetlanymi na standardowym wyjściu informacjami

wysyłają dodatkowe informacje informujące o błędach przetwarzania na standardowe wyjście

diagnostyczne. Istnieje możliwość niezależnego przekierowania strumienia diagnostycznego,

poprzez operator > poprzedzony numerem wyjścia diagnostycznego, czyli 2:

%cat plik1.txt plik2.txt 2> plik3.err

Polecenie to spowoduje wyświetlenie zawartości plików plik1.txt i plik2.txt oraz zapisanie

informacji o błędach do pliku plik3.err .

W celu pominięcia komunikatów o błędach, wyjście diagnostyczne można przeadresować

do pliku /dev/null. Wszystko co zostaje wysłane do pliku null, znajdującego się w katalogu

/dev zostanie utracone:

%cat plik1.txt plik2.txt> plik3.txt 2> /dev/null

Polecenie to spowoduje zapisanie zawartości plików plik1.txt i plik2.txt do pliku plik3.txt

oraz jednocześnie zignoruje komunikaty o błędach.

str. nr 2 /7

Laboratorium systemów operacyjnych – ćwiczenie nr 4.

[ilość modułów: 1]

W przypadku gdy strumień diagnostyczny ma trafiać tam, gdzie strumień wyjściowy,

należy użyć zapisu 2>&1 :

%cat plik1.txt plik2.txt> plik3.txt 2>&1

III. Przetwarzanie potokowe

Standardowe wyjście jednego procesu możne być połączone ze standardowym wejściowym

innego procesu, tworząc tzw. potok pomiędzy tymi procesami.

stdin

stdout

potok

stdin

stdout

Proces A

Proces B

Rysunek 2: Potok

Przetwarzanie potokowe polega na buforowaniu przez system danych produkowanych

przez pierwszy proces i następnie odczytywaniu tych danych przez drugi proces. Innymi

słowy proces w potoku czyta dane z wejścia, które zostało przeadresowane na wyjście

procesu poprzedniego. W potoku może brać udział jednocześnie kilka procesów. Poniżej

podano przykłady potoków:

1. Proces ls podaje wynik procesowi more , który w efekcie wyświetla listing strona po

stronie:

ls – al|more

2. Proces who podaje wynik procesowi sort , podając posortowaną listę pracowników

pracujących w systemie:

who|sort

3. Proces ps podaje wynik procesowi grep , wyszukując na liście procesów linii

zawierających słowo csh:

ps -ef|grep csh

4. Proces ls podaje wynik procesowi sort , który następnie podaje wynik procesowi

head , wyświetlając pierwszych 10 najmniejszych plików:

ls -l /usr/bin|sort -bnr +4 -5|head.

IV. Filtry

Istnieją programy, których zadaniem jest odczyt danych ze standardowego wejścia,

przetworzenie tych danych i ich zapis na standardowe wyjście. Programy takie nazywane są

filtrami i są szeroko wykorzystywane w przetwarzaniu potokowym. Poniżej przedstawiono

najczęściej wykorzystywane filtry:

cat – najprostszy filtr, nie wprowadzający zmian do przetwarzanych danych. Użyteczne

str. nr 3 /7

Laboratorium systemów operacyjnych – ćwiczenie nr 4.

[ilość modułów: 1]

przełączniki:

– s z paru pustych linii robi jedna

– n numeruje wszystkie linie

– b numeruje niepuste linie

-A pokazuje znaki specjalne

head – wyświetla początkową część pliku o podanej nazwie lub danych wejściowych

otrzymanych z potoku gdy nazwa pliku nie jest podana. Standardowo wyświetlanych jest

pierwszych 10 linii odczytanych danych. Używając przełączników liczbę tą można zmienić:

– c pozwala określić liczbę wyświetlanych znaków

–n pozwala określić liczbę wyświetlanych linii

tail – wyświetla końcową część pliku o podanej nazwie lub danych wejściowych

otrzymanych z potoku, gdy nazwa pliku nie jest podana,. Standardowo wyświetlanych jest

ostatnich 10 linii danych. Używając przełączników liczbę tą można zmienić:

– c pozwala określić liczbę wyświetlanych znaków

–n pozwala określić liczbę wyświetlanych linii

–f powoduje, że dane po zapisaniu ich do pliku są wyświetlane na standardowym

wyjściu

sort – służy do sortowania danych wejściowych, które domyślnie sortowane są

leksykograficznie. Sortowanie danych odbywa się liniami. Najważniejsze przełączniki:

–n pozwala sortować numerycznie

– b ignoruje przy sortowaniu spacje znajdujące się na początku linii

-t pozwala zmienić domyślny separator kolumn, którym są znaki tabulacji lub spacji

-f pozwala ignorować przy sortowaniu wielkość liter

-r odwraca kolejność sortowania

+liczba pozwala by sortowanie odbywało się względem dowolnej kolumny

( a nie początku linii). Liczba określa liczbę kolumn pominiętych przy

sortowaniu

-o nazwa_pliku zapisuje rezultat sortowania do pliku o podanej nazwie

uniq – umozliwia usunięcie powtarzających się, sąsiadujących linii danych wejściowych.

–d wyświetla z danych wejściowych tylko linie powtarzające się

–u wyświetla z danych wejściowych tylko linie unikalne

–c zlicza liczbę powtórzeń

str. nr 4 /7

Laboratorium systemów operacyjnych – ćwiczenie nr 4.

[ilość modułów: 1]

wc – zlicza znaki, słowa i linie w podanych danych wejściowych. Standardowo

wyświetlane są wszystkie trzy wartości, ale można to zmienić:

–l pozwala zliczać tylko linie

–w pozwala zliczać tylko słowa

-c pozwala zliczać tylko znaki

tr – pozwala zamienić łańcuchy tekstowe, które podawane są jako argumenty wejściowe.

Znaki z pierwszego łańcuch zamieniane są na znaki z drugiego łańcucha. Dodatkowo,

dzięki przełącznikom możliwe jest następujące przetwarzanie:

–d usuwa podane po przełączniku znaki

– s usuwa powtarzające się sąsiednie znaki

cut – pozwala wyświetlić fragmenty wierszy danych wejściowych. Zwykle jest to

wycinanie odpowiednich kolumn.

–c pozwala określić pozycję znakowe wycinanych fragmentów wierszy, np. -c 1-72

wyświetla pierwsze 72 znaki każdego wiersza

–f pozwala określić numery wycinanych kolumn, np. -f1,3-5,10 wyświetla pierwszą

kolumnę, kolumny od 3 do 5 oraz kolumnę 10.

–d pozwala zmienić domyślny separator kolumn, którym jest znak tabulacji

grep [opcje] wyrażenie [lista_plików]- przeszukuje dane pochodzące ze

standardowego wejścia lub pliki wyszczególnione na liście plików, wypisując tylko linie

zawierające szukane wyrażenie. Szukane wyrażenie zapisywane jest za pomocą wyrażenia

regularnego. Najważniejsze przełączniki:

-v wyszukuje linie nie zawierające szukanego wzorca

-c podaje liczbę odszukanych wyrażeń

-i ignoruje wielkość liter przy wyszukiwaniu

-n wyświetla numery linii zawierających dany wzorzec

-h przy wyświetlaniu linii zawierających szukany wzorzec pomija nazwy plików

-r pozwala na przeszukiwanie rekurencyjne, np. grep wzorzec –r katalog

-l pokazuje nazwy plików zawierających określony wzorzec

-L pokazuje nazwy plików nie zawierających określonego wzorca

Zasady konstrukcji podstawowych wyrażeń regularnych opisujących szukany wzorzec są

następujące:

. – reprezentuje dowolny znak

[abc] – oznacza jeden ze znaków a, b lub c

[a-z]- oznacza jeden ze znaków z podanego zbioru

[^0-9] – oznacza dopełnienie podanego zbioru

.* - oznacza dowolny ciąg znaków

* - reprezentuje powtórzenie dowolną liczbę razy wyrażenia znajdującego się

str. nr 5 /7

Plik z chomika:

Inne pliki z tego folderu:

Inne foldery tego chomika: