Video: C Programlama Dersleri 25 - Fonksiyonlar Nedir ? 2024
C ++'daki standart char değişkeni, 1 bayt genişliğinde ve yalnızca 255 farklı karakteri işleyebilir. Bu, Avrupa dilleri için yeterince bol ancak kanji gibi sembol temelli dilleri işleyecek kadar büyük değil.
Bu dillerin taleplerini karşılamak için karakter kümesini genişletmek için birçok standart ortaya çıkmıştır. UTF-8, aklınıza gelebilecek hemen hemen her kanji veya hiyeroglif uygulamak için 8-, 16- ve 32-bit karakterlerin bir karışımını kullanır, ancak basit 8-bit ASCII ile hala uyumlu kalır. UTF-16, genişletilmiş bir karakter kümesi elde etmek için 16 ve 32 bitlik karakterlerin bir karışımını kullanır ve UTF-32, tüm karakterler için 32 bit kullanır.
UTF, Unicode Dönüşüm Biçimi'nin kısaltmasıdır ve buradan ortak Unicode takma adını alır.
Tabloda, C ++ tarafından desteklenen farklı karakter türleri açıklanmaktadır. Başlangıçta, C ++ belirsiz bir şekilde tanımlanmış geniş karakter türünü wchar_t ile bulmaya çalıştı. Bu tür, uygulama programının ortamına özgü geniş karakter türü olması amaçlanmıştır. C ++ '11, UTF-16 ve UTF-32 için belirli türleri tanıtıyordu.
C ++ Karakter TürleriUTF-16, Windows uygulamaları için standart kodlamadır. Wchar_t türü, Code:: Blocks / gcc derleyicisinde UTF-16'ya başvurur.
Tablodaki karakter türleri herhangi bir dizgeye de birleştirilebilir:
wchar_t * wideString = L "geniş bir dizge";