Ci�gi Znak�w I Wzorce

Ci�gi PHP to seria bajt�w i nie zawieraj� �adnych informacji o tym, jak te bajty powinny zosta� przet�umaczone na znaki. PHP przechowuje d�ugo�� a�cucha wraz z jego zawarto�ci� i nie polega na znaku ko�cz�cym, oznaczaj�cym koniec �a�cucha. Pomaga to uczyni� �a�cuchy bezpiecznymi, poniewa� znaki puste w �a�cuchu nie powoduj� zamieszania. W systemach 32-bitowych ci�g mo�e by� tak du�y, jak 2 GB. Nie ma szczeg�lnego limitu d�ugo�ci �a�cucha w 64-bitowym systemie PHP.

Deklarowanie ci�g�w

W PHP ci�gi znak�w mog� by� deklarowane jako typy proste lub z�o�one. R�nica polega na tym, �e z�o�one �a�cuchy b�d� oceniane w odniesieniu do znak�w kontrolnych i zmiennych. Proste ci�gi znak�w s� deklarowane w "cudzys�owie", a ci�gi z�o�one s� deklarowane w "podw�jnym cudzys�owie". W tym przyk�adzie znak nowej linii jest wyprowadzany po Hello Bob, ale w prostym ci�gu s� wyprowadzane dos�owne znaki.

< ?php
$name = 'Bob';
$a = 'Hello $name\n';
$b = "Hello $name\n";
echo $a; // Hello $name\n
echo $b; // Hello Bob

Zauwa� r�wnie�, �e zmienna $name jest oceniana jako ci�g "Bob" i jest wstawiana do zmiennej zespolonej $b, gdy jest ona wyprowadzana. Przyjrzymy si� temu bardziej szczeg�owo w poni�szej sekcji

Osadzanie zmiennych

Jedn� z g��wnych zalet z�o�onych ci�g�w jest to, �e PHP je parsuje i automatycznie ocenia zawarte w nich nazwy zmiennych. Podczas korzystania z prostych ci�g�w, kt�re nie s� analizowane, nale�y zako�czy� ci�g i po��czy� z nim zmienn�. Nazwy zmiennych s� oznaczone przez $ w PHP. Gdy parser napotka jeden znak $ w ci�gu, pr�buje utworzy� nazw� zmiennej, dodaj�c jak najwi�cej znak�w alfanumerycznych, aby utworzy� prawid�ow� nazw� zmiennej. Poni�szy przyk�ad ilustruje r�nic� mi�dzy konkatenacj� parametr�w aran�acyjnych z �a�cuchami i osadzaniem ich w z�o�onych �a�cuchach.

< ?php
$catfood = "Cheeseburgery";
echo 'Mog� mie� $catfood'; // Mog� mie� $ catfood
echo 'Mog� mie�'. $catfood; // Mog� mie� Cheeseburgery?
echo "Mog� mie� $catfood?"; // Mog� mie� Cheeseburgery?

Zauwa�, �e pierwszy ci�g znak�w jest oznaczony pojedynczymi cudzys�owami, wi�c $catfood nie jest przetwarzany na zmienn�. Jest raczej wyprowadzany jako dos�owne znaki. Aby uwzgl�dni� zmienne w prostych ci�gach, nale�y je po��czy�, jak pokazuje drugi przyk�ad. Trzecia instrukcja echo pokazuje przyk�ad nazwy zmiennej ocenianej w z�o�onym ci�gu. Analizator sk�adni napotka symbol $, a nast�pnie pobierze wszystkie nast�puj�ce po nim znaki, kt�re s� zgodne z nazw� zmiennej. Symbol znaku zapytania nie jest dozwolony w nazwach zmiennych, wi�c PHP wstawia dos�own� warto�� zmiennej $catfood do �a�cucha. Mo�liwe jest tak�e do��czanie sk�adni tablicowej i obiektowej do podw�jnych cudzys�ow�w:

< ?php
$dogfood = ['Pellets'];
$catfood = new stdClass();
$catfood->favorite = "Cheeseburger";
echo "$dogfood[0]"; // Pellets
echo "$catfood->favorite"; // Cheeseburger

PHP pozwala na u�ycie nawias�w klamrowych, aby wyra�nie powiedzie� parserowi, �e cz�� a�cucha musi zosta� oceniona. Jest to konieczne, na przyk�ad, podczas wyprowadzania elementu z tablicy, gdzie mo�e nie by� od razu jasne, �e nawiasy kwadratowe maj� s�u�y� jako interpunkcja w �a�cuchu znak�w lub jako sk�adnia w odniesieniu do elementu w tablicy. Sp�jrzmy na kilka przyk�ad�w jego u�ycia:

$burger = "Cheeseburger";
echo "Mog� mie� {$ burger}"; // Mog� mie� Cheeseburger
echo "Mog� mie� ${burger}"; // Mog� mie� Cheeseburger
echo "Mog� mie� $burgery"; // brak zmiennej $burgery
echo "Mog� mie� {$burger}y"; // Mog� mie� Cheeseburgery
echo "Mog� mie� {$burger}"; // Mog� mie� {Cheeseburger}

Zauwa�, �e nie mo�esz u�ywa� spacji mi�dzy nawiasami klamrowymi a zmienn�, kt�r� chcesz oceni�. Poniewa� nawiasy klamrowe wyra�nie wskazuj� koniec zmiennej w ci�gu, mo�liwe jest do��czanie znak�w bezpo�rednio po nich. We wcze�niejszym przyk�adzie widzieli�my, �e "{$ burger}ys" jest renderowane jako Cheeseburgery. Sp�jrzmy na przyk�ad, w kt�rym mieszamy sk�adni� w�a�ciwo�ci tablicy i obiektu, aby pokaza�, jak nawiasy klamrowe mog� pom�c:

< ?php
$ catfood = new stdClass();
$ catfood-> name = "Cheeseburgers";
$ cat = new stdClass ();
$ cat-> canhaz = [$ catfood];
echo "$ cat-> canhas [0] -> name"; // konwersja tablic na ci�gi
echo "{$ cat-> canhas [0] -> name}"; // Cheeseburgery

Znaki Steruj�ce

Kiedy PHP napotka z�o�ony ci�g, zadeklarowany w cudzys�owie, oceni go pod k�tem zmiennych i znak�w kontrolnych. Znaki kontrolne s� oznaczone odwrotnym uko�nikiem, po kt�rym nast�puje kod. U�ycie odwrotnego uko�nika, po kt�rym nast�puje cokolwiek innego ni� znak kontrolny, spowoduje wy�wietlenie odwrotnego uko�nika.

echo "Hello \ World"; // Hello \World

Strona PHP Manual na sekwencjach ucieczki1 zawiera list� znak�w kontrolnych, kt�rych mo�na u�y�, ale tutaj s� one w formie tabeli:

Sekwencja : Znaczenie

\n : nowa linia
\r : Powr�t karetki
\t : tabulator
\v Zak�adka pionowa
\e : Ucieczka
\f : Znak ASCII ko�cz�cy stron�
\\ : Uko�nik wsteczny
\$ : Symbol dolara
[0-7] {1,3} Sekwencje pasuj�ce do tego wyra�enia regularnego s� w notacji �semkowej
\x [0-9A-Fa-f] {1,2} Pasuj�ce sekwencje s� w notacji szesnastkowej
\u {{0-9a-f} {1,6}} Pasuj�ce sekwencje s� kodem Unicode, kt�ry b�dzie wyj�ciem do �a�cucha, poniewa� ten kod podpisuje reprezentacj� UTF-8

Emoji maj� punkty ko�cowe Unicode, wi�c mo�emy wypisa� elePHPant w nast�puj�cy spos�b:

< ?php
echo "\ u {1F418}"; //

Oczywi�cie bardziej formalnym przypadkiem u�ycia Unicode jest internacjonalizacja (i18n).

Heredoc i Nowdoc

Heredoc to wygodny spos�b na zadeklarowanie ci�gu obejmuj�cego wiele wierszy. Zamiast dodawa� wiele znak�w nowego wiersza, mo�esz zadeklarowa� ci�g w jednym �atwym formacie. Ci�gi heredoc s� oceniane pod k�tem znak�w kontrolnych i zmiennych, podobnie jak ci�gi podw�jnego cudzys�owu. Typowe zastosowania heredoc obejmuj� tworzenie zapyta� SQL lub tworzenie sformatowanych fragment�w kodu HTML dla wiadomo�ci e-mail lub stron internetowych. Mo�esz ich r�wnie� u�y� do zainicjowania zmiennych lub w dowolnym innym miejscu, w kt�rym chcesz u�y� ci�gu obejmuj�cego wiele wierszy. Nowdoc zosta� wprowadzony w PHP 5.3.0 i ma na celu heredoc jakie ci�gi pojedynczego cudzys�owu s� ci�gami podw�jnie cytowanymi. Innymi s�owy, nowdocs nie s� oceniane pod k�tem znak�w specjalnych i zmiennych. Heredocs u�ywaj� nast�puj�cej sk�adni:

< ?php
echo << To jest ci�g heredoc, uwaga:
1) wielkie litery znacznika
2) nazwa znacznika podlega zmiennym regu�om nazewnictwa
3) gdzie jest znacznik zamykaj�cy
HEREDOC;

Uwaga: Znacznik zamykaj�cy musi zaczyna� si� od pierwszego znaku nowej linii.

Okre�l, �e ci�g jest nowdoc, a nie heredoc, zawijaj�c etykiet� w pojedyncze cudzys�owy, jak poni�ej:

< ? php
echo <<< 'NOWDOC'
To jest ci�g nowdoc, uwaga:
1) Pojedyncze cudzys�owy wok� etykiety
2) Zmienne nie b�d� oceniane
3) Znaki kontrolne nie b�d� oceniane
NOWDOC;

Odwo�ywanie si� do znak�w w ci�gach

Mo�esz odwo�a� si� do pozycji w �a�cuchu, u�ywaj�c nawias�w kwadratowych lub nawias�w klamrowych, aby wskaza� pozycj� ca�kowit� liczon� od zera, do kt�rej chcesz si� odwo�ywa�.

< ? php
$ hello = "world";
echo $hello [0]; // w
echo $hello{1}; // o

Uwaga : Pami�taj, �e ci�gi znak�w s� seri� bajt�w i odwo�ujesz si� do pozycji bajt�w. Je�li Tw�j zestaw znak�w zawiera wi�cej ni� jeden bajt na znak, nie uzyskasz oczekiwanego wyniku.

W bie��cej wersji PHP wy�wietli ostrze�enie o zakresie, je�li spr�bujesz zapisa� w ujemnej pozycji ci�gu lub je�li nie okre�lisz liczby ca�kowitej. Zapis do pozycji, kt�ra jest poza zasi�giem spowoduje, �e �a�cuch zostanie wype�niony spacjami, aby pomie�ci� brakuj�c� sekcj�.

< ?php
$ hello = "world";
$ hello [10] = "*";
echo $hello; // world *

Zwr�� uwag� na ko�cow� gwiazdk� w poprzednim przyk�adzie.

PHP i ci�gi wielobajtowe

PHP implementuje ci�gi znak�w jako tablic� bajt�w z liczb� ca�kowit� wskazuj�c� d�ugo�� bufora (nie zako�czona zerem). PHP nie przechowuje informacji o sposobie kodowania �a�cucha. Schemat kodowania o zmiennej szeroko�ci wykorzystuje kody o r�nej d�ugo�ci do kodowania zestawu znak�w. Kodowania wielobajtowe u�ywaj� r�nej liczby bajt�w do kodowania znak�w. Kodowanie wielobajtowe pozwala na zakodowanie wi�kszej liczby znak�w i ich reprezentacj� na komputerze. Jednym ze schemat�w kodowania, kt�re cz�sto spotykasz w PHP, jest UTF-8. Jest to domy�lny schemat, kt�rego PHP spr�buje u�y� do kodowania wielobajtowego. Natywne funkcje �a�cuch�w w PHP zak�adaj�, �e �a�cuchy s� tablic� pojedynczych bajt�w, wi�c funkcje takie jak substr(), strpos(), strlen() i strcmp() nie b�d� dzia�a� na �a�cuchach wielobajtowych. Powiniene� u�y� wielobajtowych odpowiednik�w tych funkcji, takich jak na przyk�ad mb_substr().

Unicode

Unicode by� pr�b� ujednolicenia wszystkich zestaw�w kod�w reprezentuj�cych znaki. Unicode definiuje punkty kodowe, kt�re s� abstrakcyjnymi koncepcjami znaku. Punkt kodowy Unicode reprezentuje znak i jest zapisany w nast�puj�cy spos�b: U + 0041. Ten numer jest przypisany do du�ej litery "A". Nie ma limitu znak�w, kt�re mo�e przechowywa� Unicode. Pocz�tkowo istnia�o pewne zamieszanie dotycz�ce tego, �e Unicode ma dwa bajty, ale dotyczy�o to schematu kodowania, a nie samego Unicode.

Uwaga : Unicode sam nie jest systemem kodowania. Kodowanie to spos�b reprezentowania znaku Unicode.

UTF-8 przechowuje wszystkie punkty kodowe od 0-127 w jednym bajcie. Obejmuje to ca�y zakres alfabetu angielskiego, cyfr i niekt�rych symboli. Punkty kodowe powy�ej 127 s� przechowywane w wielu bajtach (do 6 bajt�w). Poniewa� punkty kodowe Unicode od 0-127 pasuj� do tabeli ASCII od 0-127, tekst angielski zakodowany w UTF-8 wygl�da dok�adnie tak samo, jakby by� zakodowany w ASCII. Tylko ludzie, kt�rzy pisali znaki z akcentami, mogliby sko�czy� z plikiem zakodowanym inaczej ni� ASCII. Istniej� setki schemat�w kodowania, kt�re mog� przechowywa� niekt�re punkty kodowe Unicode, ale nie wszystkie. Je�li u�yjesz jednego z tych kodowa� i napotkasz znak Unicode, kt�rego nie mo�na przedstawi�, pojawi si� znak zapytania lub puste pole. Na przyk�ad, je�li tw�j schemat kodowania jest ukierunkowany na przechowywanie znak�w hebrajskich i pr�bujesz przechowywa� w nim rosyjskie znaki, otrzymasz kilka znak�w zapytania zamiast rosyjskich znak�w, poniewa� schemat kodowania ich nie obs�uguje.

Informowanie klient�w o kodowaniu �a�cucha

Nie mo�esz z ca�� pewno�ci� wykry�, w jaki spos�b �a�cuch zosta� zakodowany (chyba �e sam go zakodowa�e�), a klienci nie mog� r�wnie� zu�ywa� twoich danych wyj�ciowych. O ile klient nie wie, jak kodowany jest ci�g, nie b�dzie w stanie wy�wietli� go z pewno�ci�. Twoim zadaniem jako programisty PHP jest informowanie klient�w czytaj�cych dane wyj�ciowe HTML, w jaki spos�b s� one kodowane. Nale�y okre�li� schemat kodowania znak�w u�ywany w nag��wku HTTP Content-Type. Dzi�ki temu klient wie, w jaki spos�b kodowane s� twoje dane wyj�ciowe, a tym samym, jak je poprawnie wy�wietli�. Umieszczenie typu zawarto�ci w HTML jako metatagu jest nieco mniej satysfakcjonuj�ce, poniewa� je�li klient nie zna typu kodowania, nie b�dzie w stanie odczyta� HTML w celu ustalenia kodowania. Mo�esz to zrobi� w ten spos�b, ale lepiej tego nie robi�.

Prze��czanie mi�dzy schematami kodowania

Rozszerzenie mbstring zapewnia szereg funkcji, kt�rych mo�na u�y� do wykrywania i konwertowania schemat�w kodowania. Funkcja mb_detect_encoding () przejdzie przez list� mo�liwych kodowa� i spr�buje ustali�, w jaki spos�b kodowany jest ci�g. Mo�esz zmieni� kolejno�� wykrywania za pomoc� funkcji mb_detect_order() lub dostarczaj�c list� kodowa� jako CSV lub tablic�. Za pomoc� mb_convert_encoding () mo�na konwertowa� ci�g znak�w mi�dzy formatami kodowania.

Praktyczny przyk�ad

Ten przyk�ad pokazuje niekt�re aspekty zachowania si� �a�cuch�w w PHP. Deklaruje tablic� z trzema r�nymi sposobami przywitania si�, a nast�pnie uruchamia polecenia �a�cuchowe na ka�dym z nich, aby zilustrowa� niekt�re punkty.

< ?php
$waysToSayHello = [
'emoji' => "\u{1F44B}",
'latinchars' => "Hello",
'accentedChars' => "�a va?"
];
foreach ($waysToSayHello as $method => $string) {
echo "$method : encoding [" . mb_detect_encoding($string,
'ISO-8859-1') . '] ' .
'encoding [' . mb_detect_encoding($string, ['ASCII','UTF-8']) . '] ' .
'strlen [' . strlen($string) . '] ' .
'mb_strlen [' . mb_strlen($string) . '] ' .
'first character[' . $string[0] . ']';
echo "\r\n";
}
/*
emoji : encoding [ISO-8859-1] encoding [UTF-8] strlen [4] mb_strlen [1]

first character[? ]
latinchars : encoding [ISO-8859-1] encoding [ASCII] strlen [5] mb_strlen [5]
first character[H]
accentedChars : encoding [ISO-8859-1] encoding [UTF-8] strlen [7] mb_strlen
[6] first character[ ? ]
*/

Pami�taj, �e PHP nie przechowuje informacji o kodowaniu w ci�gu, wi�c mo�e tylko zgadywa�, w jaki spos�b kodowany jest ci�g. Funkcja mb_detect_encoding zbada ci�g znak�w i spr�buje ustali�, co to jest. Odbywa si� to poprzez por�wnanie �a�cucha z list� schemat�w kodowania i wybranie pierwszego schematu, w ramach kt�rego �a�cuch jest prawid�owo kodowany. Mo�esz okre�li� kodowanie (w kolejno�ci), aby PHP pr�bowa�o polega� na domy�lnym kodowaniu. To wyja�nia, dlaczego dane wyj�ciowe z mb_detect_encoding s� r�ne dla tego samego ci�gu - dajemy PHP r�ne wskaz�wki na temat tego, co mo�e by�. Zauwa�, �e wynik funkcji strlen() r�ni si� od mb_strlen. Funkcja strlen zwraca liczb� bajt�w w ci�gu, a nie liczb� znak�w. Na koniec zauwa�, �e je�li u�yjemy metody notacji tablicowej, aby uzyska� dost�p do pozycji w ci�gu, otrzymamy znacz�cy wynik, tylko je�li ci�g jest zakodowany w formacie jednobajtowym.

Dopasowanie ci�g�w

Por�wnywanie ci�g�w w PHP powinno odbywa� si� z odpowiednim poziomem ostro�no�ci, gdy pr�bujesz dopasowa� r�ne typy zmiennych. W rozdziale 1, sekcja "Rzutowanie zmiennych", przeanalizowali�my strony podr�cznika dotycz�ce rzutowania. Upewnij si�, �e wiesz, jak PHP rzutuje r�ne typy zmiennych na �a�cuch. Korzystanie z operator�w por�wnania, takich jak > i <, nie zawsze mo�e dzia�a� zgodnie z oczekiwaniami. Cz�sto oczekuje si�, �e PHP u�yje kolejno�ci alfabetycznej do oceny ci�g�w znak�w wzgl�dem tych operator�w. Zamiast korzysta� z sortowania alfabetycznego, PHP u�ywa warto�ci ASCII znaku do por�wnania. Ma�e litery maj� wy�sz� warto�� ASCII ni� wielkie litery, wi�c mo�esz mie� sytuacj�, w kt�rej ma�e litery s� umieszczane po wielkich literach, tak jak tu:

< ?php
$a = "PHP";
$b = "developer";
if ($a > $b) {
echo "$a > $b";
} else {
echo "$a < $b";
}
// developer wyst�puje przed PHP w alfabecie
// ale ten skrypt wy�wietla
// PHP < developer

Przypomnij sobie zasady konwertowania ci�g�w na liczby ca�kowite om�wione w rozdziale "Rzutowanie zmiennych". W poni�szym przyk�adzie ci�g jest rzutowany na liczb� ca�kowit� 12, kt�ra jest r�wna warto�ci zmiennoprzecinkowej 12,00, a zatem komunikat jest powtarzany.

< ?php
$a = "12 o'clock";
$b = 12.00;
if ($a == $b) {
echo "Mysz wybieg�a z zegara";
}

Je�li nie masz pewno�ci co do ci�g�w, kt�re por�wnujesz, powiniene� rozwa�y� u�ycie operatora to�samo�ci ===, aby dokona� tego rodzaju por�wnania. Opr�cz korzystania z operator�w PHP udost�pnia r�wnie� szereg funkcji por�wnywania ci�g�w. strcmp () to funkcja s�u��ca do por�wnywania bezpiecznych ci�g�w binarnych. Jako argument przyjmuje dwa �a�cuchy i zwraca <0, je�li str1 jest mniejszy ni� str2; > 0, je�li str1 jest wi�kszy ni� str2, i 0, je�li s� r�wne.

Wskaz�wka : Pami�tasz operator spaceship? Operator mo�e by� u�ywany na dowolnym typie zmiennej, ale strcmp jest przeznaczony wy��cznie dla �a�cuch�w.

Istnieje r�wnie� wersja bez rozr�niania wielko�ci liter o nazwie strcasecmp (), kt�ra najpierw konwertuje ci�gi na ma�e, a nast�pnie por�wnuje je. Ten przyk�ad pokazuje r�nic�:

< ?php
$a = "PHP";
$b = "developer";
$comparison = strcmp($a, $b);
echo $comparison . PHP_EOL; // -20
$caseInsensitive = strcasecmp($a, $b);
echo $caseInsensitive . PHP_EOL; // 12

Funkcje strncmp() i strcasencmp() mog� by� u�ywane tylko do por�wnywania pierwszych "n" znak�w dw�ch ci�g�w. PHP ma bardzo pot�n� funkcj� o nazwie similar_text(), kt�ra oblicza podobie�stwo mi�dzy dwoma �a�cuchami. Mo�e to by� bardzo kosztowna pod wzgl�dem obliczeniowym procedura dla d�ugich fragment�w tekstu, dlatego nale�y zachowa� ostro�no�� przed u�yciem. Pami�taj r�wnie�, �e kolejno�� przekazywania argument�w jest znacz�ca, wi�c similar_text($ a, $ b)! = similar_text ($ b, $ a). Innej funkcji, levenshtein(), mo�na u�y� do obliczenia odleg�o�ci Levenshteina mi�dzy dwoma �a�cuchami. Odleg�o�� Levenshteina jest definiowana jako minimalna liczba znak�w, kt�re musisz zast�pi�, wstawi� lub usun��, aby przekszta�ci� str1 w str. Aby por�wna� podci�gi, mo�esz u�y� funkcji binarnie bezpiecznej substr_compare (). PHP ma dwie funkcje, kt�re pozwalaj� pracowa� z d�wi�kiem �a�cucha. Funkcja soundex() oblicza klucz na podstawie tego, jak brzmi �a�cuch. Ci�gi, kt�re brzmi� tak samo, b�d� mia�y ten sam klawisz soundex. Funkcja metaphone() w podobny spos�b tworzy ten sam klawisz dla podobnych ci�g�w d�wi�kowych. Jest dok�adniejszy ni� soundex(), poniewa� zna podstawowe zasady angielskiej wymowy. Oczywi�cie mo�e to by� ma�o pomocne w innych j�zykach! Istniej� dwa inne sposoby por�wnywania ci�g�w, ale zosta�y one om�wione w rozdziale 6 dotycz�cym bezpiecze�stwa. Funkcja hash_equals() to bezpieczny spos�b por�wnywania ci�g�w z atakiem czasowym, a password_verify() to bezpieczny spos�b sprawdzania, czy has�o pasuje do skr�tu. Dowiesz si� o nich bardziej szczeg�owo p�niej, ale zapami�taj je jako funkcje �a�cuchowe

Wyodr�bnianie ci�g�w

Do pojedynczej pozycji w ci�gu mo�na odwo�ywa� si� przy u�yciu tej samej sk�adni, co element tablicy. Wszystkie pozycje w ci�gu s� zawsze zerowane - pierwszy znak w ci�gu to pozycja 0.

< ?php
$string = 'abcdef';
echo $string[0]; // a

Mo�esz u�y� funkcji substr(), aby zwr�ci� cz�� lub plasterek �a�cucha. Podr�cznik PHP dla substr() pokazuje sk�adni� polecenia tak:

`string substr (string $ string, int $ start [, int $ length])`

Wida�, �e wymaga dw�ch parametr�w obowi�zkowych i jednego parametru opcjonalnego. Zar�wno parametry pocz�tkowe, jak i d�ugo�ci mog� by� dodatnie lub ujemne. Je�li warto�� pocz�tkowa jest wi�ksza ni� d�ugo�� ci�gu, substr() zwr�ci false. Je�li warto�� pocz�tkowa jest dodatnia (lub 0), odcinek zwr�conego ci�gu zaczyna si� od pocz�tkowej pozycji ci�gu licz�c od pocz�tku. W przeciwnym razie, je�li jest ujemny, odcinek zaczyna si� w pozycji pocz�tkowej od ko�ca �a�cucha.

< ?php
echo substr("abcdef", 2) . PHP_EOL; // cdef
echo substr("abcdef", -2) . PHP_EOL; // ef

Je�li d�ugo�� zostanie pomini�ta, jak w poprzednim przyk�adzie, wycinek b�dzie kontynuowany od punktu pocz�tkowego wycinka do ko�ca �a�cucha. Je�li d�ugo�� jest podana jako liczba dodatnia, w�wczas zwracane b�d� maksymalnie znaki d�ugo�ci. Je�li d�ugo�� jest podana jako liczba ujemna, w�wczas tyle znak�w zostanie pomini�tych na ko�cu ci�gu:

< ?php
echo substr ("abcdef", 0, 2). PHP_EOL; // ab
echo substr ("abcdef", 0, -2). PHP_EOL; // abcd

Je�li podana jest d�ugo�� i wynosi 0, FA�SZ lub NULL, zwracany jest pusty ci�g znak�w. To samo dzieje si�, gdy parametr pocz�tkowy jest wi�kszy lub r�wny ci�gowi. Podr�cznik PHP podaje kilka innych przyk�ad�w:

< ?php
echo substr ("abcdef", 1); // bcdef
echo substr ("abcdef", 1, 3); // bcd
echo substr ("abcdef", 0, 4); // abcd
echo substr ('abcdef', 0, 8); // abcdef
echo substr ('abcdef', -1, 1); // f

Wyszukiwanie ci�g�w

Poniewa� PHP zosta� napisany dla Internetu, jest szczeg�lnie silny w przetwarzaniu ci�g�w. Oczekuje si�, �e poznasz tajniki funkcji manipulacji ci�gami. W tej sekcji opisano funkcje u�ywane do wyszukiwania ci�g�w. Zdecydowanie zaleca si� eksperymentowanie z funkcjami i przeczytanie ich na stronach podr�cznika. Egzamin Zend jest raczej nastawiony na nagradzanie do�wiadczenia ni� na encyklopedyczn� znajomo�� podr�cznika.

Przydatne porady

Cz�st� skarg� na PHP jest to, �e trudno jest ustali� kolejno�� parametr�w wyszukiwania ci�g�w i tablic. Parametry wyszukiwania PHP maj� $haystack;, a my szukamy $needle. Por�wnaj kolejno�� parametr�w u�ywanych dla strpos() i array_search():

< ?php
$arr = ['a', 'b', 'c', 'd', 'e', 'f' ];
$str = 'abcdef';
echo strpos($str, 'c') . PHP_EOL;
echo array_search('c', $arr) . PHP_EOL;

Z pocz�tku wydaje si�, �e czasami parametr $ ig�a jest najwa�niejszy, a czasem parametr $ haystack. Jest jednak o wiele prostsze, gdy pami�tasz, �e PHP korzysta z bazowych bibliotek C, a sp�jna regu�a to:

• W przypadku funkcji wyszukiwania ci�g�w kolejno�� to zawsze $hystack, a nast�pnie $needle
• W przypadku funkcji wyszukiwania tablic kolejno�� to zawsze $needle, a nast�pnie $haystack

Nast�pn� przydatn� wskaz�wk� jest zapami�tanie r�nicy mi�dzy 0 a fa�szem. Chocia� warto�� logiczna fa�szu jest r�wna 0, to je�li rzutujesz j� na liczb� ca�kowit�, liczba 0 nie jest identyczna z warto�ci� logiczn� fa�sz. Oto przyk�ad, w kt�rym najwyra�niej nie znajdujemy litery "a" w ci�gu "abcdef":

< ?php
$string = 'abcdef';
if (strpos($string, 'a') == false) {
echo "False negative!" . PHP_EOL;
}

Pami�taj, �e �a�cuchy s� zerowe, wi�c pierwsza pozycja to pozycja 0. strpos() zwraca liczb� ca�kowit� 0, poniewa� znalaz� "a" na pierwszej pozycji. U�ywamy operatora r�wno�ci == do sprawdzania wyniku strpos (), wi�c fa�szywie zg�aszamy, �e litera "a" nie pojawia si� w tym ci�gu.

Wskaz�wka Aby obs�u�y� przypadek, w kt�rym podci�g nie zosta� naprawd� znaleziony, powiniene� u�y� operatora to�samo�ci ===

Szybki przegl�d funkcji wyszukiwania

PHP ma kilka funkcji u�ywanych do wyszukiwania ci�g�w. Zasadniczo funkcje bez rozr�niania wielko�ci liter maj� przedrostek "i". Poni�sza tabela zawiera definicje instrukcji PHP dla funkcji wyszukiwania ci�g�w.

Funkcja : U�ywana dla

substr_count() : Zwraca liczb� wyst�pie� pod�a�cucha w ci�gu.
strstr() : Wyszukuje podci�g w ci�gu znak�w i zwraca cz�� haystack, kt�ry pojawia si� po pierwszym znalezionym wyst�pieniu. Zwraca falsz, je�li nie zostanie znalezione �adne wyst�pienie. Zauwa�, �e u�ycie strpos() jest leps, poniewa� jest szybsza.
stristr(): Wersja strstr() bez rozr�niania wielko�ci liter.
strchr() : Zwraca cz�� ci�gu przed pierwszym wyst�pieniem zmiennej needle.
strpos() Zwraca pozycj� pierwszego wyst�pienia needle
stripos() : Wersja strpos() bez rozr�niania wielko�ci liter.
strspn() : Znajduje d�ugo�� pocz�tkowego segmentu �a�cucha sk�adaj�cego si� ca�kowicie ze znak�w zawartych w danej masce
strcspn() : Zwraca d�ugo�� pocz�tkowego segmentu podmiotu, kt�ry to robi i nie mo�e zawiera� �adnych znak�w w masce. Innymi s�owy, wyszukuje pierwsze wyst�pienie dowolnej litery maski w ci�gu i zwraca liczb� znak�w, kt�re istniej� przed nim.

Zast�powanie ci�g�w

PHP ma trzy funkcje zast�powania ci�g�w. str_replace() i jego wersja bez rozr�niania wielko�ci liter str_ireplace() mog� by� u�ywane do podstawowych zamian

< ?php echo str_replace('foo', 'bar', 'Delicious food');

Obie przyjmuj� trzy obowi�zkowe parametry - ci�g wyszukiwania, ci�g zast�puj�cy i ci�g, na kt�rym maj� dzia�a�. Je�li przeka�esz opcjonaln� czwart� zmienn� (jest to argument referencyjny), zostanie ona ustawiona na liczb� zamiennik�w wykonanych przez PHP. Zar�wno parametry wyszukiwania, jak i zast�pcze mog� by� tablicami. Pozwala to zast�pi� wiele warto�ci w jednym wywo�aniu, jak w tym przyk�adzie:

< ?php
$string = "I like black hot coffee";
$search = ['black', 'coffee'];
$replace = ['green', 'tea'];
echo str_replace($search, $replace, $string); //Lubi� zielon� gor�c� herbat�

Mo�esz u�y� funkcji substr_replace(), aby zast�pi� podci�gi. substr_replace() zast�puje kopi� ci�gu ograniczonego parametrami pocz�tkowymi i (opcjonalnie) ci�giem podanym w zast�pstwie. strtr() to kolejna funkcja zast�puj�ca podci�gi i znaki. Je�li podano tylko dwa parametry, drugim parametrem powinna by� tablica par zast�pczych. W przeciwnym razie pobiera trzy parametry, poniewa� w tym przyk�adzie z podr�cznika PHP jest on u�ywany do konwersji znak�w ze znakami akcentu na znaki w formacie angielskim:

$ address = "09479 Huopainenkyl�, P�hjois-Karjala";
$ address = strtr ($ address, "�?�", "aao");
echo $ adres; // 09479 Huopainenkyloa, Pohjois-Karjala

Najbardziej elastycznym i wydajnym sposobem zamiany napis�w jest u�ycie funkcji preg_match(), kt�ra pozwala na u�ycie wyra�e� regularnych do znalezienia wycink�w ci�gu do zamiany.

Formatowanie ci�g�w

Funkcja printf() s�u�y do wy�wietlania sformatowanego ci�gu. Powiniene� przeczyta� uwa�nie instrukcj� PHP7 i upewni� si�, �e �wiczy�e� korzystanie z niej. Og�lnym zastosowaniem jest okre�lenie ci�gu formatuj�cego i warto�ci, kt�re nale�y w nim umie�ci�.

< ?php
$minutes = 60;
$timeUnit = "an hour";
printf("There are %u minutes in %s.", $minutes, $timeUnit);

W tym przyk�adzie zauwa�ysz, �e pierwszy parametr printf() ma dwa symbole zast�pcze oznaczone symbolami procentowymi. Nast�puj�ce parametry to warto�ci, kt�re musz� by� rzutami typu i wstawione do tych symboli zast�pczych. Istnieje wiele symboli, kt�rych mo�na u�y� do sformatowania parametr�w. Znajdziesz t� list� na stronie internetowej PHP 8, ale dla Twojej wygody zamieszczam j� tutaj:

Symbolu : Format

%% : Dos�owny znak procentu. Nie jest wymagany �aden argument.
%b : Argument jest traktowany jako liczba ca�kowita i prezentowany jako liczba binarna.
%c : Argument jest traktowany jako liczba ca�kowita i prezentowany jako znak z t� warto�ci� ASCII.
%d : Argument jest traktowany jako liczba ca�kowita i prezentowany jako (ze znakiem) liczba dziesi�tna.
%e : Argument jest traktowany jako notacja naukowa (np. 1,2e + 2). Precyzja specyfikator oznacza liczb� cyfr po przecinku od PHP 5.2.1. We wcze�niejszych wersjach by�a przyjmowana jako liczba znacz�cych cyfr (jeden mniej).
%E : Podobnie jak %e, ale u�ywa du�ej litery (np. 1,2E + 2).
%f : Argument jest traktowany jako zmiennoprzecinkowy i przedstawiany jako zmiennoprzecinkowa liczba (zale�na od ustawie� regionalnych).
%F : Argument jest traktowany jako zmiennoprzecinkowy i przedstawiany jako zmiennoprzecinkowa liczba (nieobs�uguj�cy ustawie� regionalnych). Dost�pne od PHP 4.3.10 i PHP 5.0.3.
%g : Kr�tszy od% e i% f.
%G : Kr�tszy od% E i% f.
%o ; Argument jest traktowany jako liczba ca�kowita i prezentowany jako liczba �semkowa.
%s : Argument jest traktowany i prezentowany jako ci�g.
%u : Argument jest traktowany jako liczba ca�kowita i prezentowany jako liczba dziesi�tna bez znaku
%x : Argument jest traktowany jako liczba ca�kowita i prezentowany jako szesnastkowa liczba (ma�ymi literami).
%X : Argument jest traktowany jako liczba ca�kowita i prezentowany jako szesnastkowa liczba (z du�ymi literami).

Formaty PHP s� zale�ne od ustawie� regionalnych, co wp�ywa na to, jak reprezentuj� liczby i daty. Na przyk�ad, je�li ustawisz ustawienia regionalne na niderlandzki, w�wczas data b�dzie podawana w j�zyku niderlandzkim. Jest to pokazane w przyk�adzie w podr�czniku PHP:

< ?php
// Ustaw j�zyk na holenderski
setlocale(LC_ALL, 'nl_NL');
// Output: vrijdag 22 december 1978
echo strftime("%A %e %B %Y", mktime(0, 0, 0, 12, 22, 1978));

Uwaga Informacje regionalne s� przechowywane dla poszczeg�lnych proces�w, a nie w�tk�w.

Je�li korzystasz z PHP na wielow�tkowym interfejsie API serwera, takim jak IIS, HHVM lub Apache w systemie Windows, mo�esz do�wiadczy� nag�ych zmian ustawie� regionalnych podczas dzia�ania skryptu, chocia� sam skrypt nigdy nie nazywa si� setlocale(). Dzieje si� tak, poniewa� inne skrypty dzia�aj� jednocze�nie w r�nych w�tkach tego samego procesu, zmieniaj�c ustawienia narodowe ca�ego procesu za pomoc� setlocale(). W systemie POSIX mo�na u�y� ustawie� regionalnych polecenia pow�oki -a, aby wy�wietli� list� wszystkich obs�ugiwanych ustawie� narodowych. Na komputerach z systemem Windows w MSDN znajduj� si� strony z list� region�w, kt�re mo�na wy�wietli� w panelu sterowania

Formatowanie liczb

Funkcja number_format() to prosty spos�b formatowania liczb. number_format() nie rozpoznaje ustawie� regionalnych, wi�c nie wybierze automatycznie znak�w separatora. Domy�lnie separator tysi�cy jest przecinkiem i nie s� wy�wietlane miejsca dziesi�tne. Ta funkcja pobiera parametry do sformatowania liczby, liczby miejsc dziesi�tnych do wy�wietlenia, znaku kropki dziesi�tnej i znaku separatora tysi�cy. Do funkcji mo�na przekaza� jeden, dwa lub cztery parametry. Oto przyk�ad:

< ?php
$number = 1234.5678;
// 1,235
echo number_format($number) . PHP_EOL;
// 1,234.568
echo number_format($number, 3) . PHP_EOL;
// 1.234,57
echo number_format($number, 2, ',', '.') . PHP_EOL;

Aby sformatowa� walut�, mo�esz u�y� funkcji money_format (). Jest rozpoznawany przez ustawienia regionalne i wykorzystuje informacje ustawione przez system hosta.

< ?php
// Ustawienia regionalne to angielski brytyjski
setlocale(LC_MONETARY, 'en_GB');
echo money_format('%.2n', "5000000.123");
// Ustawienia regionalne to Dania
setlocale(LC_MONETARY, 'da_DK');
echo money_format('%.2n', "5000000.123");

Dane wyj�ciowe wygl�daj� nast�puj�co:

5 000 000 ? 12
5.000.000,12 kr

Wzory ci�g�w: wyra�enia regularne

Wyra�enia regularne to zestaw regu�, do kt�rych dopasowujesz ci�gi. Regu�y s� zapisywane jako ci�g znak�w w formacie opisuj�cym szukany wzorzec. Istnieje kilka smak�w wyra�e� regularnych; PHP u�ywa wyra�e� regularnych zgodnych z Perl (PCRE). Ucz�c si� wyra�e� regularnych, powiniene� znale�� tester wyra�e� regularnych online, kt�ry Ci si� podoba. Istnieje kilka do wyboru, dzi�ki czemu gra z wyra�eniami jest o wiele szybsza i pozwala sprawdzi�, jak pasuj� do siebie.

Ograniczniki

Wyra�enia regularne s� rozdzielane znakami, kt�re pojawiaj� si� na pocz�tku i na ko�cu ka�dego wzorca w twoim wyra�eniu. Zwykle u�ywa si� uko�nika, ale # i ! s� r�wnie� powszechne. Mo�na u�y� dowolnego znaku, ale separator b�dzie wymaga� zmiany znaczenia w wyra�eniach, wi�c standardem jest wyb�r separatora, kt�ry prawdopodobnie nie b�dzie wyst�powa� w wyszukiwanym wyra�eniu. Na przyk�ad, je�li b�dziesz przeszukiwa� katalogi w celu znalezienia tych, kt�re pasuj� do wzorca, znak uko�nika do przodu mo�e nie by� najlepszym wyborem separatora.

Meta-Znaki

Meta-znaki s� interpretowane jako maj�ce znaczenie we wzorcu wyszukiwania. Trzeba je uciec, je�li zamierzasz je traktowa� dos�ownie. S� one wymienione w poni�szej tabeli.

Znak : Znaczenie

\ : Og�lna posta� ucieczki
^ : Pocz�tek tematu lub linii
$ : Koniec tematu lub wiersza
. : Dopasuj dowolny znak opr�cz nowej linii
[ : Zacznij definiowa� klas� znak�w
] : Koniec definiowania klasy znak�w
| : Pocz�tek alternatywnej ga��zi (np. "Lub")
( : Pocz�tek pod-wzoru
) : Koniec pod-wzoru
? : Zero lub jeden kwantyfikator
* : Zero lub wi�cej kwantyfikatora
+ : Jeden lub wi�cej kwantyfikator�w
{ : Rozpocznij kwantyfikator min / maks
} : Koniec kwantyfikatora min / maks

B�dziemy na tym opiera� si� podczas pracy, ale na razie pami�taj, �e te symbole maj� okre�lone znaczenie w wyra�eniu regularnym lub wzorze. Musisz si� z nimi zapozna� przed przyst�pieniem do egzaminu.

Og�lne typy znak�w

Regex oferuje spos�b, aby okre�li�, �e znak w ci�gu wyszukiwania mo�e by� dowolnego okre�lonego typu. Podajesz je za pomoc� meta-znaku odwrotnego uko�nika (Escape), a nast�pnie podaj�c liter� typu. W poni�szej tabeli wymieniono typy znak�w dost�pne w PCRE.

Symbol : Rodzaj znaku

\d : Ka�da cyfra dziesi�tna
\h : Dowolny poziomy bia�y znak
\s : Dowolny bia�y znak
\v : Dowolny pionowy znak spacji
\w : Dowolny znak "s�owo"
\D :Dowolny znak, kt�ry nie jest cyfr� dziesi�tn�
\H : Dowolny znak, kt�ry nie jest poziom� bia�� spacj�
\S : Dowolny znak, kt�ry nie jest spacj�
\V : Dowolny znak, kt�ry nie jest pionowym znakiem spacji
\W : Dowolny znak "inny ni� s�owo"

Od razu powiniene� zauwa�y�, �e symbol wielkiej litery jest odwrotno�ci� symbolu ma�ej litery. Znak "s�owo" to dowolna litera, cyfra lub znak podkre�lenia. Rzeczywiste znaki zawarte w tym s� zale�ne od ustawie� regionalnych.

Granice

Granica s�owa to pozycja w ci�gu, w kt�rej bie��cy znak i poprzedni znak nie pasuj� zar�wno do \w, jak i do \W. Innymi s�owy, jest to pozycja w ci�gu, w kt�rej s�owo zaczyna si� lub ko�czy, lub pozycja, w kt�rej jeden ze znak�w pasuje do \w, a drugi do \W.

Symbol : Granica

\b : Granica s�owa
\B : Brak granicy s�owa
\A : Pocz�tek tematu
\Z : Koniec tematu lub nowej linii na ko�cu
\z : Koniec tematu
\G : Pierwsza pasuj�ca pozycja w temacie

Klasy znak�w

Klasy znak�w s� bardzo elastycznymi sposobami definiowania, jaki zestaw znak�w w ci�gu wyszukiwania mo�na dopasowa�. Okre�laj�c ma�� sekwencj� znak�w we wzorcu, mo�esz dopasowa� znacznie wi�kszy zestaw znak�w w wyszukiwanym ci�gu. W tabeli meta-znak�w zobaczy�e�, �e tworzysz klas� znak�w, umieszczaj�c j� w nawiasach kwadratowych. Przyk�adem klasy znak�w jest [A-Z], kt�ra oznacza wszystkie litery wielkimi literami. Mo�esz tak�e u�y� wszystkich typ�w og�lnych w klasach postaci, wi�c [A-Z \ d] dopasuje wszystkie wielkie litery oraz cyfry.

Dopasowywanie wi�cej ni� raz

Wyra�enie / [A-Z \ d] / zastosowane do ci�gu "abc123ABCabc" b�dzie pasowa� do znaku "1". Innymi s�owy, pasuje do pierwszego wyst�pienia w ci�gu wyszukiwania znaku, kt�ry pasuje do wyra�enia. Je�li odwo�ujesz si� z powrotem do tabeli dotycz�cej metaznak�w, mo�esz zobaczy�, �e symbol + mo�e by� u�yty do okre�lenia, �e chcesz mie� jeden lub wi�cej wzorca. Zatem wyra�enie / [A-Z \ d] + / zastosowane do ci�gu "abc123ABCabc" b�dzie pasowa�o do znak�w "123ABC". Mo�esz u�y� nawias�w klamrowych, aby ograniczy� liczb� dopasowa�. Sk�adnia najlepiej wy�wietla si� w tabeli, w kt�rej dopasowuje si� wyra�enie do ci�gu "abc123ABCabc":

Wyra�enie : Ograniczenie : Wyj�cie

/ [A-Z \ d] + / : Jeden lub nieograniczone : 123ABC
[A-Z \ d] {3} : Dok�adnie trzy : 123
[A-Z \ d] {3,} ; Trzy lub wi�cej : 123ABC
[A-Z \ d] {3,5} : Od trzech do pi�ciu : 123AB
[A-Z \ d] {50} : Dok�adnie 50 : Brak dopasowania

Przechwytywanie grup

Grupy przechwytywania s� oznaczone nawiasami kwadratowymi i umo�liwiaj� zastosowanie kwantyfikatora do grupy. Tworz� r�wnie� ponumerowane grupy, kt�re przechowuj� dopasowan� warto��, i mo�na si� do nich odwo�ywa� w innym miejscu wyra�enia. W tym przyk�adzie tworzymy grup� przechwytywania wok� s�owa "cheeseburger" i u�ywamy tej grupy, aby okre�li�, �e zero lub jeden z nich zostanie dopasowany.

< ?php
$subject = "I can haz Cheeseburgers";
$pattern = "/I can haz (Cheeseburger)?/";
$matches = [];
preg_match($pattern, $subject, $matches);
var_dump($matches[0]);

Daje to string (22) "I can haz Cheeseburger". Zauwa�, �e "s" na ko�cu �a�cucha nie jest dopasowany.

Wskaz�wka W ramach �wiczenia zagraj wyra�eniem regularnym w swoim ulubionym edytorze i zobacz, co si� stanie, je�li u�yjesz tematu "Mog� mie�" (bez spacji na ko�cu �a�cucha).

Aby zoptymalizowa� zapytanie, mo�esz u�y� grup nie przechwytuj�cych. Powiniene� ich u�y�, gdy nie musisz przechwytywa� dopasowania. S� one oznaczone poprzez umieszczenie znaku ?: . na pocz�tku grupy. Poprzedni przyk�ad zosta� napisany jako / I can haz (?: Cheeseburger)? /. Pami�taj, �e to wyra�enie nadal zwr�ci ci�g znak�w do PHP, ale po prostu nie zapisze �a�cucha Cheeseburger jako grupy dla wyra�enia, do kt�rego mo�na si� odwo�ywa�. Mo�e wydawa� si� myl�ce, �e ? jest kwantyfikatorem, a tak�e oznacza grup� nie przechwytuj�c�. Pami�taj tylko, �e kwantyfikator nie mo�e wyst�pi� na pocz�tku grupy, poniewa� nie ma nic do kwantyfikacji.

Chciwo�� i lenistwo

Domy�lnie dopasowanie jest "zach�anne" i b�dzie pasowa� jak tylko to mo�liwe do ci�gu. Rozwa� przyk�ad, z kt�rym b�dziesz pracowa�. Wyobra� sobie, �e chcesz dopasowa� znacnziki HTML, wi�c spr�buj wykona� nast�puj�ce czynno�ci:

< ?php
$subject = "Some html text";
$pattern = "/<.*>/";
$matches = [];
preg_match($pattern, $subject, $matches);
var_dump($matches[0]); // string(21) "html"

Daje to string(21) " html ", kt�ry daje wyra�nie wi�cej ni� po��dany znaczniki HTML.

Winna jest za to chciwo��; kwantyfikator * jest zach�anny i pr�buje znale�� jak najd�u�sze dopasowanie. Zwraca znaki mi�dzy otwieraj�cym znacznikiem , co jest najd�u�szym mo�liwym dopasowaniem. Natomiast leniwe wyszukiwanie zwraca mo�liwie najkr�tsze dopasowanie. Mo�esz zmodyfikowa� kwantyfikator, aby by� leniwy, dodaj�c do niego znak zapytania (?).

< ?php
$subject = "Some html text";
$pattern = "/<.*?>/"; // note the pattern has changed
$matches = [];
preg_match($pattern, $subject, $matches);
var_dump($matches[0]); // string(8) ""

Istnieje wiele innych opcji modyfikacji kwantyfikator�w

Uzyskiwanie wszystkich dopasowa�

Do tej pory wyra�enia zwracaj� tylko pierwsze wyst�pienie pasuj�cej cz�ci ci�gu wyszukiwania. Powiedzmy, �e chcesz znale�� wszystkie dopasowania w ci�gu. PCRE ma globalny modyfikator, ale PHP u�ywa osobnej funkcji o nazwie preg_match_all(), aby zwr�ci� wszystkie dopasowania.

< ?php
$subject = "Some html text";
$pattern = "/<.*?>/";
$matches = [];
preg_match_all($pattern, $subject, $matches);
var_dump($matches);
/*
array(1) {
[0] =>
array(2) {
[0] => string(8) ""
[1] => string(9) ""
}
}
*/

Grupy nazw
na pocz�tku nawiasu otwieraj�cego grup�. Na przyk�ad:

< ?php
$subject = "test@example.com";
$pattern = "/^(?< username >\w+)@(?< domain >\w+).(?< tld >\w+)/";
$matches = [];
if (preg_match($pattern, $subject, $matches)) {
var_dump($matches);
}

W tym przyk�adzie nazywamy pierwsz� cz�� pasuj�cego wzorca nazw� u�ytkownika, nast�pn� domen�, a nast�pn� tld. Jest to do�� naiwny przyk�ad, poniewa� nie dzia�a na adresy e-mail, takie jak test@example.co.uk, ale s�u�y do pokazania sk�adni. Poprzedni przyk�ad wyprowadza to:

array(7) {
[0] => string(16) "test@example.com"
'username' => string(4) "test"
[1] => string(4) "test"
'domain' => string(7) "example"
[2] => string(7) "example"
'tld' => string(3) "com"
[3] => string(3) "com"
}

Mo�esz wi�c odwo�a� si� do $matches ['username'] i otrzyma� w odpowiedzi "test", co jest wygodne.

Modyfikatory wzorc�w

Mo�esz doda� modyfikator po ograniczniku zamykaj�cym wyra�enie. Poni�sze tabele zawieraj� modyfikatory.

Modyfikator : Funkcja

i : W wyra�eniu nie jest rozr�niana wielko�� liter.
m : Tryb wielowierszowy. Ci�gi mog� obejmowa� wiele linii a znaki nowej linii s� ignorowane. Zamiast dopasowywa� pocz�tek i koniec �a�cucha, symbole ^ i $ b�d� pasowa� do pocz�tku i ko�ca linii.
s : meta-znak .b�dzie r�wnie� pasowa� do nowych linii.
x : Zignoruj bia�e znaki, chyba �e ich unikniesz.
e : To powoduje, �e kod PHP jest oceniany i jest wysoce odradzany. To jest przestarza�e od PHP 5.5 i PHP 7 wygeneruje ostrze�enie, poniewa� nie jest ju� obs�ugiwane.
U : To sprawia, �e kwantyfikatory s� domy�lnie leniwe i u�ywaj�? zamiast oznaczeni ich jako chciwych.
u : To m�wi PHP, aby traktowa� wzorzec i �a�cuch jako kodowane w UTF-8. Oznacza to, �e znaki zamiast bajt�w s� dopasowane.

QUIZ

P1: Nie mo�na por�wna� zmiennej �a�cuchowej ze zmienn� ca�kowit�, u�ywaj�c operator�w wi�kszych lub mniejszych ni�. Mo�na por�wnywa� tylko ci�g i warto�ci ca�kowite z operatorem r�wnowa�no�ci.

---------------------
Prawdziwe
Fa�szywy

P2: Mo�esz u�y� funkcji ________, aby dokona� binarnie bezpiecznych por�wna� ci�g�w bez rozr�niania wielko�ci liter.

---------------------
⇔
strcmp
strcasecmp
stricmp

P3: Funkcje PHP przeszukuj�ce ci�gi ZAWSZE maj� parametry w okre�lonej kolejno�ci.

---------------------
$haystack, $needle
$needle, $haystack
To zale�y od funkcji

P4: Do czego s�u�y funkcja strspn ($subject, $mask)?

---------------------
Przeszukuje ci�g $subject w poszukiwaniu podci�gu $mask
Zwraca maksymaln� d�ugo�� a�cucha w $subject, kt�ry zawiera tylko litery zawarte w $ mask
Zwraca minimaln� d�ugo�� a�cucha w $subject, kt�ry zawiera wszystkie litery zawarte w $ mask
Jest to binarnie bezpieczny spos�b na podzielenie ci�gu okre�lonego przez $ mask na ci�g $ podmiot

P5: Do czego s�u�y funkcja strstr ($haystack, $needle)?

---------------------
Jest to szybsza alternatywa dla strpos()
Jest to binarnie bezpieczna alternatywa dla strpos()
Zwraca cz�� $haystack, kt�ra wyst�puje po pierwszym wyst�pieniu $needle
Zwraca pozycj� w $haystack, w kt�rej po raz pierwszy pojawia si� $needle

P6: Jakie s� wyniki tego kodu?

< ?php
$ fact = "Psy robi� tylko sen";
$ fact = strtr ($ fact, "Dog", "Cat");
echo $ fakt;

---------------------
0
Koty robi� tylko sen
Cats da nathint but sleep
To generuje b��d

P7: Kt�re z tych wyra�e� regularnych zidentyfikuje oba adresy e-mail (i tylko adresy e-mail) w nast�puj�cym tek�cie. Wybierz tyle, ile dotyczy. "Przewr�� choink� na �cian� kittens@catsaregreat.com, baw si� jedzeniem i daj si� zwie�� kurzowi lub z�ap siamese@catsaregreat.com dzi� czerwon� kropk�, aby dzi� z�apa� czerwon� kropk�.".

---------------------
[a-z] *. [a-z.] +
\ b [a-z] + @ [a-z] +. com \ b
\ b [a-z] + @ [a-z.] + \ b
(\ b [a-z] * @ \ b) ([a-zA-Z \ d] +)
(\ S *) @ (\ w *). (\ S *)

P8: Jakie s� wyniki tego kodu?

echo substr ("abcdefgh12345678");

---------------------
abcdefgh12345678
Nic
Ostrze�enie
B��d krytyczny

P9: Kt�ra z poni�szych funkcji s�u�y do funkcji preg_replace_callback ()?

---------------------
U�yj funkcji zwrotnej, aby poda� ci�g zast�puj�cy zamiast ci�gu statycznego
U�yj funkcji zwrotnej, kt�ra zwraca list� dopasowa� do zast�pienia
Okre�l funkcj�, kt�ra ma by� wywo�ywana po zako�czeniu dzia�ania preg_replace ()
Nie ma takiej funkcji

ODPOWIEDZI

• Fa�szywy

• strcasecmp

• $haystack, $needle

• Zwraca maksymaln� d�ugo�� a�cucha w $subject, kt�ry zawiera tylko litery zawarte w $mask

• Zwraca cz�� $haystack, kt�ra wyst�puje po pierwszym wyst�pieniu $needle

• Cats da nathint but sleep

• \ b [a-z] + @ [a-z] +. com \ b ; \ b [a-z] + @ [a-z.] + \ b ; (\ b [a-z] * @ \ b) ([a-zA-Z \ d] +); (\ S *) @ (\ w *). (\ S *)

• Ostrze�enie

• U�yj funkcji zwrotnej, aby poda� ci�g zast�puj�cy zamiast ci�gu statycznego

Certyfikat ZendPHP

Ci�gi Znak�w I Wzorce

QUIZ

ODPOWIEDZI