NAZWA¶
perldata - typy danych Perla
OPIS¶
Nazwy zmiennych
Perl posiada trzy typy struktur danych: skalary, tablice skalarów oraz
asocjacyjne tablice skalarów, zwane też "haszami"
("hashes"). Zwykłe tablice indeksowane są liczbami,
począwszy od 0 (indeksy ujemne są liczone od końca tablicy).
Tablice asocjacyjne indeksowane są łańcuchami.
Wartości są zwykle przypisane do nazwy (lub nazwanego odwołania).
Pierwszy znak nazwy mówi o tym, do jakiego rodzaju struktury danych
się ona odnosi. Reszta nazwy określa konkretną
wartość, do której odnosi się nazwa. Najczęściej
składa się ona z pojedynczego
identyfikatora, to znaczy,
łańcucha rozpoczynającego się literą lub znakiem
podkreślenia i zawierającego litery, podkreślenia i cyfry. W
niektórych przypadkach może być ciągiem
identyfikatorów, rozdzielonych przez :: (lub przez ', ale nie jest to
polecane). Wszystkie oprócz ostatniego interpretowane są jako nazwy
pakietów, wskazując przestrzenie nazw, w których będzie
wyszukiwany ostatni identyfikator (szczegóły znajdziesz w sekcji
Packages podręcznika
perlmod(1)). Możliwe jest
zastąpienie prostego identyfikatora wyrażeniem, które w czasie
wykonania tworzy odwołanie do wartości; jest to opisane
szczegółowo poniżej oraz na stronie
perlref(1)
podręcznika.
Istnieją również zmienne specjalne, których nazwy nie
przestrzegają powyższych reguł, po to by nie kolidowały
przypadkowo z którąś z twych zwykłych zmiennych.
Łańcuchy, które pasują do objętych nawiasami
okrągłymi części wyrażenia regularnego zachowywane
są pod nazwami zawierającymi tylko cyfry po znaku $ (patrz strony
perlop(1) i
perlre(1) dokumentacji). Dodatkowo, kilka zmiennych
specjalnych, umożliwiających dostęp do wewnętrznych
rozwiązań Perla, posiada nazwy zawierające znaki przestankowe
(zobacz strony
perlvar(1) dokumentacji).
Wartości skalarne zawsze noszą nazwy rozpoczynające się
znakiem '$', nawet, gdy odnoszą się do skalara będącego
częścią tablicy. Działa to podobnie jak angielski
przedimek "the". A zatem mamy:
$dni # zwykła wartość skalarna "dni"
$dni[28] # 29-ty element tablicy
$dni{'luty'} # wartość dla klucza 'luty' z hasza %dni
$#dni # ostatni indeks tablicy @dni
ale całe tablice lub wycinki tablic oznaczane są przez '@', co
działa jak angielskie słowo "these" lub "those":
@dni # ($dni[0], $dni[1],... $dni[n])
@dni[3,4,5] # to samo, co @dni[3..5]
@dni{'a','c'} # to samo, co ($dni{'a'},$dni{'c'})
zaś całe tablice asocjacyjne (hasze) oznaczane są przez '%':
%dni # (klucz1, wartość1, klucz2, wartość2 ...)
Dodatkowo, procedury nazywane są z użyciem początkowego '&',
choć jest to opcjonalne, jeśli nie jest dwuznaczne (tak jak w
języku angielskim często zbyteczne jest użycie
słowa"do"). Elementy tablicy symboli mogą być
nazywane z użyciem początkowego '*', ale na razie nie musisz
się tym zajmować.
Każdy typ zmiennych ma swoją własną przestrzeń nazw.
Możesz, bez obawy o konflikt, używać tej samej nazwy dla
zmiennej skalarnej, tablicy czy tablicy asocjacyjnej (lub uchwytu pliku, nazwy
procedury czy etykiety). Oznacza to, że $foo i @foo są dwoma
różnymi zmiennymi. Znaczy to też, że $foo[1] jest
częścią tablicy @foo, nie zaś częścią
skalara $foo. Może się to wydawać trochę dziwne, ale tak
ma być, gdyż to jest dziwne.
Ponieważ odniesienia do zmiennych i tablic zawsze rozpoczynają
się od '$', '@' lub '%', to słowa "zarezerwowane" nie
są naprawdę zarezerwowane w odniesieniu do nazw zmiennych. (Jednak
SĄ one zarezerwowane w odniesieniu do etykiet i uchwytów
plików, które nie posiadają specjalnego początkowego
znaku. Nie możesz, na przykład, użyć uchwytu pliku o
nazwie "log". Wskazówka: możesz napisać
open(LOG,'logfile') zamiast open(log,'logfile'). Użycie nazw
uchwytów plików złożonych z dużych liter poprawia
również czytelność i chroni przed konfliktami z
przyszłymi słowami zastrzeżonymi. Wielkość liter JEST
znacząca--"FOO", "Foo" oraz "foo" są
zupełnie innymi nazwami. Nazwy rozpoczynające się literą
lub znakiem podkreślenia mogą zawierać również cyfry
i podkreślenia.
Możliwe jest zastąpienie takiej alfanumerycznej nazwy wyrażeniem,
które zwraca odwołanie do obiektu danego typu. Opis tego znajdziesz
na stronie
perlref(1) podręcznika.
Nazwy rozpoczynające się cyfrą mogą zawierać tylko
cyfry. Nazwy, które nie zaczynają się od litery,
podkreślenia ani cyfry ograniczone są do pojedynczego znaku, np. $%
czy $$. (Większość z tych jednoznakowych nazw ma predefiniowane
znaczenie dla Perla. Na przykład, $$ jest identyfikatorem
bieżącego procesu.)
Kontekst
Interpretacja operacji i wartości w Perlu zależy czasami od
wymagań kontekstu, w jakim użyta jest operacja czy
wartość. Istnieją dwa główne konteksty: skalarny i
listowy. Niektóre z operacji zwracają wartości listowe w
kontekście oczekującym listy, zaś wartości skalarne w
przeciwnym przypadku. (Jeśli tak jest dla danej operacji, to zostanie to
wspomniane w jej opisie.) Innymi słowy, Perl przeciąża pewne
operacje w oparciu o to, czy spodziewana jest pojedyncza wartość czy
mnoga. (W podobny sposób funkcjonują w języku angielskim
niektóre słowa, jak "fish" czy "sheep".)
Na zasadzie wzajemności, operacja dostarcza albo kontekstu skalarnego albo
listowego każdemu ze swych argumentów. Na przykład, jeśli
napiszesz
int( <STDIN> )
to operacja całkowita (integer) dostarcza kontekst skalarny dla operatora
<STDIN>, który odpowiada czytając jeden wiersz z STDIN i
przesyłając go z powrotem do operacji integer. Ta z kolei znajduje
wartość typu integer tego wiersza i zwraca ją. Jeżeli, z
drugiej strony, napiszesz
sort( <STDIN> )
To operacja sortowania dostarcza kontekstu listowego dla <STDIN>,
który będzie przetwarzać wszystkie dostępne wiersze
aż do końca pliku. Następnie prześle listę tych
wierszy z powrotem do procedury sortowania, która z kolei posortuje
dostarczone wiersze i zwróci je w postaci listy do kontekstu w jakim
wywołano sort.
Przypisanie jest trochę specyficzne, w tym, iż posługuje się
swym lewym argumentem do ustalenia kontekstu dla prawego argumentu.
Przypisanie do skalara oblicza prawą stronę w kontekście
skalarnym, podczas gdy przypisanie do tablicy lub wycinka tablicy rozwija
prawą stronę w kontekście listowym. Przypisanie do listy
również oblicza prawą stronę w kontekście listowym.
Procedury definiowane przez użytkownika mogą sprawdzać, czy
są wywołane w kontekście skalarnym czy listowym, ale
większość z nich nie dba o to, gdyż skalary są
automatycznie interpolowane w listy. Zobacz opis funkcji wantarray na stronie
perlfunc(1).
Wartości skalarne
Wszystkie dane w Perlu są skalarami lub tablicami skalarów albo
haszami skalarów. Zmienne skalarne mogą zawierać
różne rodzaje pojedynczych danych, jak liczby, łańcuchy
znakowe czy odwołania. Ogólnie, konwersja z jednej postaci na
drugą jest transparentna. (Skalar nie może zawierać wielu
wartości, ale może zawierać odwołanie do tablicy czy hasza
zawierających wiele wartości.) Z powodu automatycznej konwersji
skalarów, operatory i funkcje zwracające skalary nie muszą
dbać o to (i faktycznie nie dbają), czy kontekst oczekuje
łańcucha czy też liczby.
Skalary nie są koniecznie tą czy inną rzeczą. Nie ma
możliwości zadeklarowania zmiennej skalarnej o typie
"string", "number", typu "filehandle", czy
jakiegoś innego. Perl jest językiem kontekstowo polimorficznym, w
którym skalary mogą być łańcuchami, liczbami czy
odwołaniami (co obejmuje obiekty). Łańcuchy i liczby
uważane są za mniejwięcej to samo w niemal każdym
zastosowaniu. Odwołania są jednak nierzutowalnymi wskaźnikami o
ściśle określonym typie, z wbudowanym licznikiem
odwołań i wywołaniami destruktora.
Wartość skalarna interpretowana jest jako prawda, TRUE, w sensie
logiki boolowskiej, jeśli nie jest łańcuchem pustym ani
liczbą zero (lub jej łańcuchowym równoważnikiem,
"0"). Kontekst boolowski (logiczny) jest po prostu specyficznym
rodzajem kontekstu skalarnego.
Faktycznie istnieją dwie odmiany skalarów pustych: zdefiniowane i
niezdefiniowane. Niezdefiniowane skalary puste zwracane są gdy brak jest
rzeczywistej wartości czegoś, jak w przypadku wystąpienia
błędu lub na końcu pliku, albo gdy odwołujesz się do
niezdefiniowanej zmiennej czy elementu tablicy. Niezdefiniowany pusty skalar
może stać się zdefiniowany po tym, jak po raz pierwszy
użyjesz go tak, jakby był zdefiniowany. Ale przed tym możesz
posłużyć się operatorem
defined(), by
stwierdzić, czy wartość jest zdefiniowana czy też nie.
By stwierdzić, czy dany łańcuch jest poprawną liczbą
niezerową wystarczy zwykle porównać go zarówno z
numerycznym 0 jak i leksykalnym "0" (choć spowoduje to
ostrzeżenia opcji
-w). Sposób ten wynika stąd, że
łańcuchy nie będące liczbami uważane są za 0,
tak jak w
awk:
if ($str == 0 && $str ne "0") {
warn "To nie wygląda na liczbę";
}
Zwykle jest to metoda preferowana, gdyż w przeciwnym razie nie
traktowałbyś poprawnie notacji IEEE, takich jak NaN czy Infinity.
Czasami będziesz wolał posłużyć się funkcją
POSIX::strtod czy wyrażeniem regularnym do sprawdzenia, czy dana jest
numeryczna. Dokładny opis wyrażeń regularnych znajdziesz w
podręczniku
perlre.
warn "has nondigits" if /\D/;
warn "not a natural number" unless /^\d+$/; # odrzuca -3
warn "not an integer" unless /^-?\d+$/; # odrzuca +3
warn "not an integer" unless /^[+-]?\d+$/;
warn "not a decimal number" unless /^-?\d+\.?\d*$/; # odrzuca .2
warn "not a decimal number" unless /^-?(?:\d+(?:\.\d*)?⎪\.\d+)$/;
warn "not a C float"
unless /^([+-]?)(?=\d⎪\.\d)\d*(\.\d*)?([Ee]([+-]?\d+))?$/;
Długość tablicy jest wartością skalarną.
Możesz uzyskać długość tablicy @dni obliczając
$#dni, tak jak w
csh. (Faktycznie, nie jest to długość
tablicy, a indeks ostatniego elementu, gdyż (zwykle) istnieje element o
indeksie zerowym.) Przypisanie do $#dni zmienia długość
tablicy. Skracanie tą metodą tablicy niszczy wartości
pozostałe za nowym końcem tablicy. Wydłużenie uprzednio
skróconej tablicy JUŻ NIE odtwarza wartości, które
były w utraconych elementach. (Było tak w Perlu 4, ale
musieliśmy z tym skończyć, by zapewnić wywoływanie
destruktorów tam, gdzie jest to oczekiwane.) Możesz też
osiągnąć nieco lepszą efektywność wstępnie
poszerzając tablicę, która ma się powiększyć.
(Można także poszerzać tablicę wykonując przypisanie
do elementu, który jest poza jej obecnym końcem.) Tablicę
można obciąć do zera przez przypisanie do niej pustej listy ().
Poniższe są równoważne:
@cokolwiek = ();
$#cokolwiek = -1;
Jeżeli przetwarzasz nazwaną tablicę w kontekście skalarnym,
to zwraca on długość tablicy. (Zauważ, że nie jest to
prawdą dla list, które zwracają ostatnią
wartość, tak jak operator przecinka w C. Nie jest to też
prawdą dla funkcji wbudowanych, zwracających to, na co mają
ochotę.) Poniższe jest zawsze prawdziwe:
scalar(@cokolwiek) == $#cokolwiek - $[ + 1;
[Zmienna specjalna $[ określa indeks pierwszego elementu w tablicy i
pierwszego znaku w łańcuchu, domyślnie jest to zero.] W wersji
5 Perla zmieniono semantykę $[: pliki nie ustawiające wartości
$[ nie muszą już zważać na to, czy inny plik zmienił
jej wartość. Inaczej mówiąc, nie zaleca się
używania $[. Zatem ogólnie możesz zakładać, że
scalar(@cokolwiek) == $#cokolwiek + 1;
Niektórzy programiści wybierają użycie jawnej konwersji, by
nie było żadnych wątpliwości:
$liczba_elementow = scalar(@cokolwiek);
Jeżeli posługujesz się haszem (tablicą asocjacyjną) w
kontekście skalarnym, to zwraca on wartość, która jest
prawdą wtedy i tylko wtedy, gdy hasz zawiera jakąkolwiek parę
klucz/wartość. (Jeżeli są takie pary, to wartość
zwracana jest łańcuchem składającym się z liczby
użytych jednostek komórek (buckets) oraz liczby zaalokowanych
jednostek komórek, rozdzielonych ukośnikiem. Najbardziej przydaje
się to do sprawdzania, czy wkompilowany w Perl algorytm haszowania
działa kiepsko na twoim zestawie danych. Na przykład, wrzucasz
10,000 elementów do hasza, ale przetworzenie %HASH w kontekście
skalarnym zwraca "1/16", co oznacza, że tylko jedna z szesnastu
komórek została użyta, i przypuszczalnie zawiera wszystkie
twoje 10,000 pozycji. To się nie powinno zdarzyć.)
Możesz wstępnie przydzielić miejsce na hasz przy pomocy
przypisania do funkcji
keys(). Zaokrągli to zaalokowane jednostki
komórek do najbliższej potęgi dwójki.
keys(%users) = 1000; # zaalokuj 1024 buckets
Konstruktory wartości skalarnych
Literały numeryczne podawane są w zwyczajowych formatach
zmiennoprzecinkowych lub całkowitych:
12345
12345.67
.23E-10
0xffff # hex
0377 # ósemkowa
4_294_967_296 # podkreślenie dla lepszej czytelności
Literały łańcuchowe ograniczone są zwykle przez pojedyncze
lub podwójne cudzysłowy. Działają one bardzo podobnie do
znaków cytowania powłoki: w literałach łańcuchowych w
cudzysłowach zachodzi zastępowanie zmiennych i interpretacja
odwrotnego ukośnika. W łańcuchach w apostrofach nie
występuje zastępowanie i interpretacja (z wyjątkiem
"\'" oraz "\\"). To tworzenia znaków takich jak nowa
linia, tabulator itd., stosowane są zarówno zwykłe reguły
użycia odwrotnego ukośnika w Unixie, jak i bardziej egzotyczne
formy. Listę sposobów cytowania znajdziesz w sekcji
Quote and
Quotelike Operators podręcznika
perlop(1).
Zapisy ósemkowe czy szesnastkowe w literałach łańcuchowych
(np. '0xffff') nie są automatycznie zamieniane na ich całkowitą
reprezentację. Konwersje te wykonują funkcje
hex() i
oct(). Więcej szczegółów znajdziesz w opisach tych
funkcji w podręczniku
perlfunc(1).
Możesz też umieszczać znaki nowej linii bezpośrednio w
łańcuchach, tj., mogą one kończyć się w innym
wierszu niż się rozpoczęły. Jest to przyjemne, ale
jeżeli zapomnisz zamykającego cudzysłowu, to błąd nie
będzie zgłaszany dopóty, dopóki Perl nie znajdzie innego
wiersza, zawierającego znak cudzysłowu, który może
znajdować się o wiele dalej w skrypcie. Zastępowanie zmiennych
w łańcuchach ograniczone jest do zmiennych skalarnych, tablic oraz
wycinków tablic. (Inaczej mówiąc, nazw rozpoczynających
się od $ lub @, po których może opcjonalnie wystąpić,
ujęte w nawiasy kwadratowe, wyrażenie traktowane jako indeks
elementu tablicy.) Poniższy fragment kodu drukuje "Cena wynosi
$100."
$cena = '$100'; # nie interpretowane
print "Cena wynosi $cena.\n"; # interpretowane
Tak jak w niektórych powłokach, możesz umieścić
nazwę w nawiasach klamrowych, by oddzielić ją od
następujących dalej znaków alfanumerycznych. Identyfikator w
takich nawiasach traktowany jest zawsze jako łańcuch, tak samo jak
pojedynczy identyfikator będący indeksem hasza. Nasz
wcześniejszy przykład,
$dni{'luty'}
może być zapisany jako
$dni{luty}
a cudzysłowy będą domniemane automatycznie. Ale cokolwiek
bardziej skomplikowanego w indeksie zostanie zinterpretowane jako
wyrażenie.
Zauważ, że łańcuch w pojedynczych cudzysłowach musi
być oddzielony od poprzedzającego go słowa odstępem,
gdyż pojedynczy cudzysłów jest poprawnym (choć nie
zalecanym) znakiem w nazwie zmiennej (zobacz Packages w podręczniku
perlmod(1)).
Trzema specjalnymi literałami są __FILE__, __LINE__ oraz __PACKAGE__,
które reprezentują nazwę bieżącego pliku, numer
wiersza oraz nazwę pakietu w danym punkcie twego programu. Mogą
być używane wyłącznie jako odrębne tokeny. Nie
będą one interpolowane wewnątrz łańcuchów.
Jeżeli nie ma bieżącego pakietu (z powodu pustej dyrektywy
package;), to __PACKAGE__ jest wartością niezdefiniowaną.
Tokenami __END__ i __DATA__ można posługiwać się do
wskazania logicznego końca skryptu przed faktycznym końcem pliku.
Dowolny następujący po nich tekst jest ignorowany, ale może
być odczytany przy pomocy uchwytu DATA. Wykorzystaj main::DATA dla
użytego tokenu __END__, lub też NAZWAPAKIETU::DATA (gdzie
NAZWAPAKIETU jest bieżącym pakietem) dla __DATA__. Dwa znaki
sterujące: ^D i ^Z są synonimami dla __END__ (lub __DATA__ w
module). Szerszy opis __DATA__ i przykład użycia znajdziesz w
podręczniku
SelfLoader. Zauważ, że nie można
czytać z uchwytu pliku DATA w bloku BEGIN. Blok ten jest wykonywany
natychmiast po napotkaniu (w czasie kompilacji). W tym momencie nie
został jeszcze znaleziony odpowiedni token __DATA__ (lub __END__).
Słowo nie posiadające żadnej innej interpretacji w gramatyce
Perla będzie traktowane tak, jakby znajdowało się w
cudzysłowie. Są one znane pod nazwą "gołych
słów" ("barewords"). Tak samo, jak w przypadku
etykiet i uchwytów plików, gołe słowa składające
się wyłącznie z małych liter narażają na konlikt
z przyszłymi słowami zastrzeżonymi. Jeżeli użyjesz
przełącznika
-w, to Perl będzie ostrzegał o
wystąpieniu takich słów. Niektórzy chcieliby
całkowicie wyjąć spod prawa gołe słowa. Jeśli
napiszesz
use strict 'subs';
to każde gołe słowo, które nie zostanie zinterpretowane jako
wywołanie procedury spowoduje błąd kompilacji. Ograniczenie to
rozciąga się do końca zawierającego je bloku. Blok
wewnętrzny może je jednak zanegować przy pomocy no strict
'subs'.
Zmienne tablicowe w łańcuchach objętych cudzysłowami
interpolowane są przez złączenie wszystkich elementów
tablicy. Elementy są wówczas rozdzielone ogranicznikiem podanym w
zmiennej $" ($LIST_SEPARATOR w module English), domyślnie
spacją. Poniższe fragmenty są równoważne:
$temp = join($",@ARGV);
system "echo $temp";
system "echo @ARGV";
Wewnątrz wzorców wyszukiwania (które również
podlegają zastępowaniu w podwójnym cytowaniu) pojawia się
brzydka niejednoznaczność: czy /$foo[bar]/ ma być
interpretowane jako /${foo}[bar]/ (gdzie [bar] jest klasą znaków
wyrażenia regularnego) czy też jako /${foo[bar]}/ (gdzie [bar] jest
indeksem tablicy @foo)? Jeżeli nie istnieje @foo, to jest to
oczywiście klasa znaków. Jeżeli @foo istnieje, to Perl odgaduje
czym ma być [bar], i prawie zawsze ma rację. Jeśli odgaduje
źle, albo po prostu jesteś paranoikiem, możesz wymusić
poprawną interpretację używając nawiasów klamrowych
jak powyżej.
Wierszowa forma cytowania oparta jest na składni
"dokumentów-tutaj" używanej ("here-doc") w
powłokach. Po sekwencji << podajesz napis ograniczający
cytowany materiał, a wszystkie wiersze poniżej bieżącego
aż do napisu kończącego są wartością elementu.
Napisem kończącym może być identyfikator (słowo) albo
jakiś cytowany tekst. Jeżeli jest to tekst cytowany, to rodzaj
zastosowanych znaków cytowania określa traktowanie tekstu, tak jak
przy zwykłym cytowaniu. Niecytowany identyfikator działa tak, jakby
był w podwójnym cudzysłowie. Pomiędzy << a
identyfikatorem nie może wystąpić spacja. (Jeżeli wstawisz
spację, to będzie ona traktowany jak pusty identyfikator, co jest
poprawne i dopasowuje pierwszy pusty wiersz.) Napis kończący musi
pojawić się w wierszu kończącym samotnie (niecytowany i
bez otaczających białych znaków).
print <<EOF;
Cena wynosi $cena.
EOF
print <<"EOF"; # to samo, co powyżej
Cena wynosi $cena.
EOF
print <<`EOC`; # wykonaj polecenia
echo hi there
echo lo there
EOC
print <<"foo", <<"bar"; # możesz składować, jeden za drugim
I said foo.
foo
I said bar.
bar
myfunc(<<"TO", 23, <<'TAMTO');
Masz tu linijkę
czy dwie.
TO
a tu jeszcze jedną.
TAMTO
Nie zapomnij tylko, że musisz postawić średnik na końcu
instrukcji. Perl nie wie przecież, czy nie zamierzasz spróbować
zrobić tego:
print <<ABC
179231
ABC
+ 20;
Konstruktory wartości listowych
Wartości listowe oznaczane są przez oddzielenie pojedynczych
wartości przecinkami (i otoczenie listy nawiasami jeśli wymaga tego
kolejność):
(LIST)
W kontekście nie wymagającym wartości listowej wartość
literału listowego jest wartością ostatniego elementu, tak jak
w przypadku występującego w C operatora przecinkowego. Na
przykład,
@foo = ('cc', '-E', $bar);
przypisuje wartość całej listy do tablicy foo, ale
$foo = ('cc', '-E', $bar);
przypisuje zmiennej foo wartość zmiennej bar. Zauważ, że
rzeczywista tablica w kontekście skalarnym zwraca długość
tablicy. Poniższy kod przypisuje $foo wartość 3:
@foo = ('cc', '-E', $bar);
$foo = @foo; # $foo dostaje 3
Przed nawiasem zamykającym listę literałów możesz
użyć opcjonalnego przecinka, zatem możesz pisać:
@foo = (
1,
2,
3,
);
LISTY dokonują automatycznej interpolacji podlist. To znaczy, kiedy
przetwarzana jest LISTA, to każdy jej element jest przetwarzany w
kontekście listowym. Wynikowa wartość listy interpolowana jest
do listy LISTA tak, jakby każdy pojedynczy element był
członkiem LISTY Zatem w LIŚCIE tracą swoją
tożsamość tablice i hasze--lista
(@foo,@bar,&SomeSub,%glarch)
zawiera wszystkie elementy @foo, po których następują wszystkie
elementy @bar, wszystkie elementy zwrócone przez procedurę o nazwie
SomeSub wywołaną w kontekście listowym, i na końcu pary
klucz/wartość z %glarch. Jeżeli chcesz odwołać
się do listy, NIE wykonując interpolacji zajrzyj do podręcznika
perlref(1).
Lista pusta reprezentowana jest przez (). Jej interpolowanie w liście nie
daje żadnego efektu. Zatem ((),(),()) jest równoważne ().
Podobnie, interpolowanie tablicy bez elementów jest tym samym, co nie
interpolowanie w tym miejscu żadnej tablicy.
Wartość listowa może być też indeksowana tak, jak
zwykła tablica. Musisz tylko umieścić listę w nawiasach,
by uniknąć niejasności. Na przykład:
# Stat zwraca wartość listową
$time = (stat($file))[8];
# TUTAJ BŁĄD SKŁADNI
$time = stat($file)[8]; # Oj, zapomniałem nawiasów
# znajdź cyfrę szesnastkową
$hexdigit = ('a','b','c','d','e','f')[$digit-10];
# "reverse comma operator"
return (pop(@foo),pop(@foo))[0];
W liście możesz wykonać przypisanie do undef. Przydaje się
to do pozbywania się niektórych wartości zwracanych przez
funkcję:
($dev, $ino, undef, undef, $uid, $gid) = stat($file);
Do list można wykonać przypisanie wtedy i tylko wtedy, gdy dozwolone
jest przypisanie do każdego z elementów listy:
($a, $b, $c) = (1, 2, 3);
($map{'czerwony'}, $map{'niebieski'}, $map{'zielony'})
= (0x00f, 0x0f0, 0xf00);
Przypisanie tablicy w kontekście skalarnym zwraca liczbę
elementów utworzonych przez wyrażenie po prawej stronie przypisania:
$x = (($foo,$bar) = (3,2,1)); # ustaw $x na 3, nie 2
$x = (($foo,$bar) = f()); # ustaw $x na ilość zwróconych przez f()
Jest to bardzo wygodne, gdy chcesz wykonać przypisanie listy w
kontekście logicznym (boolowskim), gdyż większość
funkcji listowych zwraca po zakończeniu przetwarzania listę
pustą, co przy przypisaniu daje 0, interpretowane jako fałsz.
Ostatni element może być tablicą lub haszem:
($a, $b, @rest) = split;
my($a, $b, %rest) = @_;
Faktycznie możesz umieścić tablicę lub hasza w dowolnym
miejscu listy, ale pierwsze z nich na liście wessie wszystkie
wartości i pozostałe dostaną wartość nul. Może
to być pomocne w
local() lub
my().
Literał hasza (tablicy asocjacyjnej) zawiera pary wartości, które
będą interpretowane jako klucz i wartość:
# takie samo przypisanie jak powyżej
%map = ('czerwony',0x00f,'niebieski',0x0f0,'zielony',0xf00);
Choć listy literałów i nazwane tablice są zwykle wzajemnie
wymienne, to nie zachodzi to w przypadku haszy. To, że możesz
indeksować wartości listy tak jak zwykłej tablicy nie oznacza,
że możesz indeksować listę tak jak hasz. Podobnie, hasze
włączone jako części innych list (łącznie z
listami parametrów i list zwracanych przez funkcje) zawsze ulegają
spłaszczeniu do par klucz/wartość. Dlatego czasem dobrze jest
użyć wskazania.
Często bardziej czytelne jest użycie pomiędzy parami
klucz/wartość operatora =>. Operator ten jest po prostu bardziej
wyróżniającym się wzrokowo synonimem przecinka. Ponadto
powoduje, że jego lewostronny operand jest interpretowany jako
łańcuch, jeśli jest on gołym słowem, które
mogłoby być poprawnym identyfikatorem. Uprzyjemnia to inicjowanie
haszy:
%map = (
czerwony => 0x00f,
niebieski => 0x0f0,
zielony => 0xf00,
);
lub inicjowanie odwołań do haszy, które będą
używane jako rekordy:
$rec = {
witch => 'Mable the Merciless',
cat => 'Fluffy the Ferocious',
date => '10/31/1776',
};
albo użycie wywoływanych przez nazwę parametrów
skomplikowanej funkcji:
$field = $query->radio_group(
name => 'group_name',
values => ['eenie','meenie','minie'],
default => 'meenie',
linebreak => 'true',
labels => \%labels
);
Zwróć uwagę na to, iż fakt, że tablica asocjacyjna jest
zainicjowana w takim porządku, nie oznacza, że zostanie
zwrócona w tym samym porządku. Przykłady, jak
ułożyć kolejność zwracanych wyników znajdziesz
przy opisie sort w podręczniku
perlfunc(1).
Typeglob i uchwyty plików
Perl posługuje się wewnętrznym typem zwanym
typeglob.
Przechowuje w nim wszystkie zapisy tablicy symboli. Przedrostkiem typu
typeglob jest *, gdyż reprezentuje on wszystkie typy. Był on
zalecanym sposobem przekazywania tablic i tablic asocjacyjnych przez
odwołanie do funkcji, ale obecnie istnieją prawdziwe odwołania,
więc jest to rzadko potrzebne.
Podstawowym zastosowaniem typeglob we współczesnym Perlu jest
tworzenie synonimów tablicy symboli. To przypisanie:
*cos = *inne;
robi $cos synonimem (aliasem) dla $inne, @cos jest aliasem dla @inne, %cos
aliasem dla %inne, &cos aliasem dla &inne, itd. Dużo bezpieczniej
jest użyć odwołania (wskazania). To:
local *Tutaj::niebieski = \$Tam::zielony;
tymczasowo czyni $Tutaj::niebieski aliasem dla $Tam::zielony, ale nie robi
@Tutaj::niebieski aliasem dla @Tam::zielony, czy %Tutaj::niebieski aliasem dla
%Tam::zielony, itd. W sekcji
Symbol Tables podręcznika
perlmod(1) znajdziesz więcej takich przykładów. Mimo,
że może to wyglądać dziwnie, jest to podstawą
całego systemu importu/exportu modułów.
Innym zastosowaniem typeglob jest przesyłanie uchwytów plików do
funkcji lub tworzenie nowych uchwytów. Jeżeli potrzebujesz
posłużyć się typeglob, by zachować uchwyt pliku,
zrób to tak:
$fh = *STDOUT;
albo może jako prawdziwe odwołanie, jak to:
$fh = \*STDOUT;
W podręczniku
perlsub(1) znajdziesz przykłady zastosowania
typeglob jako pośrednich uchwytów plików w funkcjach.
Typeglob są również sposobem na tworzenie lokalnych uchwytów
plików przy użyciu operatora
local(). Istnieją
wówczas aż do wyjścia z ich bloku, ale mogą być
przesłane powtórnie. Na przykład:
sub newopen {
my $path = shift;
local *FH; # nie my!
open (FH, $path) or return undef;
return *FH;
}
$fh = newopen('/etc/passwd');
Obecnie, gdy dysponujemy notacją *foo{COŚ}, typeglob nie są tak
często używane do manipulowania uchwytami plików, chociaż
wciąż są konieczne do przesłania całkiem nowego
uchwytu pliku czy katalogu do funkcji czy z funkcji. Wynika to stąd,
że *UCHWYT{IO} działa tylko jeśli UCHWYT był już
użyty jako uchwyt. Inaczej mówiąc, do tworzenia nowych
wpisów w tablicy symboli może posłużyć *FH, ale nie
*foo{COŚ}.
Inną metodą tworzenia anonimowych uchwytów plików jest
wykorzystanie modułu IO::Handle. Zaletą tych modułów jest
nieukrywanie różnych typów tej samej nazwy podczas
local(). Na końcu opisu open() w podręczniku
perlfunc(1) zamieszczono odpowiedni przykład.
Dalsze rozważania na temat typeglob i składni *foo{THING} znajdziesz w
podręcznikach
perlref(1) i
perlsub(1), a także w
sekcji
Symbol Tables podręcznika
perlmod(1).