Tema: Re: [HEPL]: Unicode ir Ubuntu LTS
Autorius: Grzegorz Brzęczyszczykiewicz
Data: 2020-11-05 00:57:41
2020-11-04 19:49, Laimis rašė:

> print_r(preg_split('/\R/u', 'Ką yra žąsine pėšhašpė?'));

Tokių raidžių pasirodo yra ir daugiau. Juos jungia tai, kad UTF-8 
kodavime jie užrašomo kaip 0xxx 0x85 (nnn 133) , kur 0x85 ASCII 
lentelėje deja bet yra „…“, „Horizontal ellipsis“.

Å - 0xC3 0x85 LATIN CAPITAL LETTER A WITH RING ABOVE
ą - 0xC4 0x85 LATIN SMALL LETTER A WITH OGONEK
Ņ - 0xC5 0x85 LATIN CAPITAL LETTER N WITH CEDILLA
ƅ - 0xC6 0x85 LATIN SMALL LETTER TONE SIX
Dž - 0xC7 0x85 LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
ȅ - 0xC8 0x85 LATIN SMALL LETTER E WITH DOUBLE GRAVE
Ʌ - 0xC9 0x85 LATIN CAPITAL LETTER TURNED V
ʅ - 0xCA 0x85 LATIN SMALL LETTER SQUAT REVERSED ESH
΅ - 0xCF 0x85 GREEK DIALYTIKA TONOS
υ - 0xCE 0x85 GREEK SMALL LETTER UPSILON
Ѕ - 0xD0 0x85 CYRILLIC CAPITAL LETTER DZE

ir tt. ir pan.



  OHNE /u :
Array
(
     [0] => �
     [1] => , �
     [2] => , �
     [3] => , �
     [4] => , �
     [5] => , �
     [6] => , �
     [7] => , �
     [8] => , �
     [9] => , �
     [10] => , �
     [11] => , �
     [12] =>
)
  MIT /u :
Array
(
     [0] => Å, ą, Ņ, ƅ, ƅ, Dž, ȅ, Ʌ, ʅ, ΅, υ, Ѕ
)

-- 
Grzegorz

Chrząszczyrzewoszyce, powiat Łękołody