1 Ekim 2022

Karakter Dizisi - Strings

JavaScript metinsel deÄŸerleri karakter dizisi olarak tutar. Bir karakter ile (char) karakter dizisi (string) arasÄ±nda bir fark yoktur.

Karakter dizisi formatÄ± her zmaan UTF-16â€™dÄ±r ve sayfanÄ±n karakter setine baÄŸlÄ± deÄŸildir.

TÄ±rnak Ä°ÅŸaretleri

Tekrar hatÄ±rlayacak olursanÄ±z, Karakter dizisi tek tÄ±rnak ve Ã§ift tÄ±rnak ile aÃ§Ä±lÄ±p kapatÄ±labilir. :

          let tek = 'tek-tÄ±rnak';
let cift = "Ã§ift-tÄ±rnak";

let us_isareti = `Ã¼s iÅŸareti`; // Backticks
        

Tek ve Ã§ift tÄ±rnak zaten aynÄ±ydÄ±. Ãœs iÅŸareti ise JavaScript ifadelerini karakter dizisine yerleÅŸtirmenizi saÄŸlar. Bu fonksiyon Ã§aÄŸrÄ±sÄ± dahil her ÅŸey olabilir:

function toplam(a, b) {
  return a + b;
}

alert(`1 + 2 = ${toplam(1, 2)}.`); // 1 + 2 = 3.

Ãœs iÅŸaretinin diÄŸer avantajÄ± ise birkaÃ§ satÄ±rdan oluÅŸan bir karakter dizisini yazabilmeniz:

let davetliListesi = `Davetliler:
 * Ä°hsan
 * Cemal
 * Muzaffer
`;

alert(davetliListesi); // birÃ§ok satÄ±rdan oluÅŸan davetiye listesi

EÄŸer yukarÄ±daki ÅŸekilde tek veya Ã§ift tÄ±rnak kullanmaya kalkarsanÄ±z hata alÄ±rsÄ±nÄ±z:

let davetliListesi = "Davetliler:  // Error: Unexpected token ILLEGAL
  * Ä°hsan";

Tek tÄ±rnak ve Ã§ift tÄ±rnak dil ilk yazÄ±lmaya baÅŸlandÄ±ÄŸÄ±, Ã§oklu satÄ±rlarÄ±n hesaba katÄ±lmadÄ±ÄŸÄ± zamanlardan kalmadÄ±r. Garip tÄ±rnak ise ( alt + , ) Ã§ok sonralarÄ± oluÅŸturulduÄŸundan Ã§ok yÃ¶nlÃ¼dÃ¼r.

Ä°lk Ã¼s iÅŸareti Ã¶ncesinde â€œÅŸablon fonksiyonuâ€ tanÄ±mlanmasÄ± da mÃ¼mkÃ¼ndÃ¼r. YazÄ±mÄ± : func`string` ÅŸeklindedir. func fonksiyonu otomatik olarak Ã§aÄŸrÄ±lÄ±r, karakter dizisi ile ve iÃ§ine gÃ¶mÃ¼lÃ¼ ifadeyi alÄ±r ve Ã§alÄ±ÅŸtÄ±rÄ±r. Bunun ile ilgili daha fazla bilgiyi dÃ¶kÃ¼manda bulabilirsiniz. Buna â€œetiketmiÅŸ ÅŸablonâ€ (tagged templates) denir. Bu ÅŸekilde karakter dizilerini Ã¶zel temalar iÃ§erisinde veya diÄŸer fonksiyonlarda kullanmak daha kolay olur, fakat yine de nadiren kullanÄ±lÄ±rlar.

Ã–zel Karakterler

â€œyeni satÄ±râ€ \n karakterini kullanarak Ã§ift tÄ±rnaklÄ± karakter dizisi iÃ§erisinde birÃ§ok satÄ±rdan oluÅŸan bir metin yazÄ±labilir:

let davetliListesi = "Davetliler:\n * Ä°hsan\n * Cemal\n * Muzaffer";

alert(davetliListesi); // birÃ§ok satÄ±rdan oluÅŸan davetiye listesi

Ã–rneÄŸin, aÅŸaÄŸÄ±daki iki satÄ±rÄ±n Ã§Ä±ktÄ±sÄ± aynÄ± olacaktÄ±r:

alert( "Merhaba\nDÃ¼nya" ); // "yeni satÄ±r" sambolÃ¼ ile iki satÄ±r.

// Ã¼s iÅŸareti ile iki satÄ±r ( altgr + , )
alert( `Merhaba
DÃ¼nya` );

â€œYeni satÄ±râ€ karakterine gÃ¶re daha az kullanÄ±lan â€œÃ¶zelâ€ karakterler bulunmaktadÄ±r:

Karakter	AÃ§Ä±klama
`\b`	Backspace
`\f`	Form feed
`\n`	Yeni SatÄ±r
`\r`	Carriage return
`\t`	Tab
`\uNNNN`	hex kodu ile bir Unicode `NNNN`, Ã¶rneÄŸin `\u00A9` â€“ `Â©` kopyalama hakkÄ± iÃ§in kullanÄ±lan iÅŸaret. Kesinlikle 4 basamaklÄ± hex deÄŸeri olmalÄ±dÄ±r.
`\u{NNNNNNNN}`	BazÄ± karakterler nadirde olsa iki Unicode sembolÃ¼ ile ifade edilirler. 4 bytten oluÅŸan uzun bir yazÄ±mÄ± vardÄ±r. Karakterlerin sÃ¼slÃ¼ parantez iÃ§ine alÄ±nmasÄ± gerekmektedir.

Unicode Ã¶rnekleri:

alert( "\u00A9" ); // Â©
alert( "\u{20331}" ); // ä½«, Uzun bir Ã§ince hiyerograf (uzun Unicode)
alert( "\u{1F60D}"); // ðŸ˜, gÃ¼len yÃ¼z sembolÃ¼ (uzun Unicode)

TÃ¼m Ã¶zel karakterler her zaman \ karakteri ile baÅŸlarlar. Karakterler normal akÄ±ÅŸÄ±nda giderken baÅŸka bir iÅŸ yapmasÄ± iÃ§in var olan iÅŸlemi kesmesinden dolayÄ± â€œkesme karakteriâ€ denebilirâ€¦

Karakter dizisi iÃ§inde kesme iÅŸareti kullanmak istersek bu iÅŸaret yardÄ±mÄ±yla yaparÄ±z.

Ã–rneÄŸin:

alert( 'N\'aber canÄ±m - TavÅŸan !' ); // N'aber canÄ±m - TavÅŸan !

GÃ¶rdÃ¼ÄŸÃ¼nÃ¼z gibi \' kullanarak karakter dizisinin bitmesi engellendi.

Tabi bu sadece baÅŸlangÄ±Ã§ karakteri ' ise geÃ§erli. Daha dÃ¼zgÃ¼n bir Ã§Ã¶zÃ¼m Ã§ift tÄ±rnak kullanmak olacaktÄ±r:

alert( "N'aber canÄ±m - TavÅŸan!" ); // N'aber canÄ±m - TavÅŸan!

Dikkat edeceÄŸiniz Ã¼zere \ JavaScriptâ€™in doÄŸru okumasÄ± amacÄ±yladÄ±r. Ekranda gÃ¶rÃ¼nmez.

Peki gerÃ§ekten \ gÃ¶sterilmek istenirse ne yapÄ±lmalÄ± ?

Bu da mÃ¼mkÃ¼n, bunun iÃ§in \\ kullanÄ±lmalÄ±:

alert( `\\` ); //  \

Karakter dizisi uzunluÄŸu

length Ã¶zelliÄŸi karakter dizisinin uzunluÄŸunu verir.

alert( `Naber\n`.length ); // 6

Dikkat ederseniz \n â€œÃ¶zel karakterâ€ olduÄŸundan dolayÄ± bir karakter olarak tanÄ±mlandÄ±.

Genelde baÅŸka diller ile Ã§alÄ±ÅŸmÄ±ÅŸ programcÄ±lar yanlÄ±ÅŸlÄ±kla str.length yerine str.length() metodunu Ã§aÄŸÄ±rmaktadÄ±rlar. BÃ¶yle bir metod yoktur.

str.length sayÄ±sal bir deÄŸerdir, fonksiyon deÄŸildir! Sonunda parantez aÃ§Ä±p kapanmaz.

Karakterlere eriÅŸim

Ä°stediÄŸiniz pozisyondaki karakteri alabilmek iÃ§in kÃ¶ÅŸeli parantez iÃ§erisinde pozisyonu neresiyse onu yazÄ±n [poz] veya bunun yerine str.charAt(pos) metodunu da kullanabilirsiniz. Ä°lk karakter 0. pozisyondur:

let str = `Selam`;

// ilk karakter
alert( str[0] ); // S
alert( str.charAt(0) ); // S

// son karakter
alert( str[str.length - 1] ); // m

KÃ¶ÅŸeli parantez karakter almanÄ±n modern yoludur, charAt ilk metodlardandÄ±r.

AralarÄ±ndaki tek fark [] eÄŸer karakteri bulamaz ise undefined dÃ¶ner. Fakat charAt boÅŸ karakter dÃ¶ner:

let str = `Selam`;

alert( str[1000] ); // undefined
alert( str.charAt(1000) ); // '' (boÅŸ karakter)

Karakterleri dÃ¶ngÃ¼ye sokmak da mÃ¼mkÃ¼ndÃ¼r.

for(let karakter of "Selam") {
  alert(karakter); // S,e,l,a,m (karakter Ã¶nce "S", sonra "e", sonra "a" vs)
}

Karakterler tanÄ±mlandÄ±ktan sonra deÄŸiÅŸtirilemezler ( immutable )

JavaScript dilinde karakter dizisi deÄŸiÅŸtirilemez. MÃ¼mkÃ¼n deÄŸildir.

Ã–rnek ile aÃ§Ä±klamak gerekirse:

let str = 'Selam';

str[0] = 's'; // hata
alert( str[0] ); // Ã§alÄ±ÅŸmaz, deÄŸiÅŸiklik olmaz

Bunun Ã§Ã¼zÃ¼mÃ¼ ise yeni bir karakter dizisi atayÄ±p strâ€™yi buna atamaktÄ±r.

Ã–rneÄŸin:

let str = 'Selam';

str = str[0] + 'ELAM' ;  // karakter dizisini tamamen deÄŸiÅŸtir.

alert( str ); // SELAM

Bir dahaki bÃ¶lÃ¼mde bunun ile ilgili daha fazla Ã¶rneÄŸe denk geleceksiniz.

Harf iÅŸlemleri

KÃ¼Ã§Ã¼k harfe Ã§evirmek iÃ§in toLowerCase() ve bÃ¼yÃ¼k harfe Ã§evirmek iÃ§in toUpperCase() metodlarÄ± kullanÄ±labilir.

alert( 'ArayÃ¼z'.toUpperCase() ); // ARAYÃœZ
alert( 'ArayÃ¼z'.toLowerCase() ); // arayÃ¼z

veya, sadece baÅŸ harfini alÄ±p kÃ¼Ã§Ã¼k harf olmasÄ±nÄ± istiyorsanÄ±z istiyorsanÄ±z:

alert( 'ArayÃ¼z'[0].toLowerCase() ); // 'a'

Karakter dizisi iÃ§inde baÅŸka bir karakter arama

Bunun iÃ§in birÃ§ok yol bulunmaktadÄ±r.

str.indexOf

Ä°lk metod str.indexOf(aranacak_karakterler, pozisyon)

Aranmak istenen karakter dizisinde str aranacak_karakterlerâ€™i arar. Pozisyon ile istenen pozisyondan aramaya baÅŸlar, eÄŸer bu karakter dizisini bulursa bulduÄŸu pozisyonu, bulamaz ise -1 dÃ¶ndÃ¼rÃ¼r.

Ã–rneÄŸin:

let str = "N`aber CanÄ±m - TavÅŸan";

alert( str.indexOf("N'aber") ); // 0, Ã§Ã¼nkÃ¼ N`aber baÅŸlangÄ±Ã§ta
alert( str.indexOf("n'aber") ); // -1, bulunamadÄ±, arama bÃ¼yÃ¼k/kÃ¼Ã§Ã¼k harf duyarlÄ±dÄ±r.

alert( str.indexOf("TavÅŸan") ); // 15, "TavÅŸan" 15. pozisyonda bulunmaktadÄ±r.

Ä°steÄŸe baÄŸlÄ± olan ikinci parametre aramaya nereden baÅŸlanacaÄŸÄ±nÄ±n belirtilmesine yarar.

Ã–rneÄŸin "an"'Ä±n ilk bulunduÄŸu pozisyon 8â€™dir. Bir sonraki denk geliÅŸi ise 19. pozisyonda olur.

let str = "N`aber CanÄ±m - TavÅŸan";

alert( str.indexOf('an', 9) ) // 19

EÄŸer sizin istediÄŸiniz tÃ¼m tekrarlar ise, indexOfâ€™u dÃ¶ngÃ¼ iÃ§erisinde kullanabilirsiniz. Her yeni Ã§aÄŸrÄ± bir Ã¶nceki pozisyonu tutar:

let str = 'Bir berber bir berbere gel birader beraber bir berber dÃ¼kkanÄ± aÃ§alÄ±m demiÅŸ';

let hedef = 'bir';

let poz = 0;
while (true) {
  let bulunanPoz = str.indexOf(hedef, poz);
  if (bulunanPoz == -1) break;

  alert( `Bulunan poz: ${bulunanPoz}` );
  poz = bulunanPoz + 1; // bir sonraki pozisyondan aramaya devam et.
}

AynÄ± algoritma aÅŸaÄŸÄ±daki ÅŸekilde daha kÄ±sa bir biÃ§imde yazÄ±labilir:

let str = 'Bir berber bir berbere gel birader beraber bir berber dÃ¼kkanÄ± aÃ§alÄ±m demiÅŸ';
let hedef = "bir";


let poz = -1;
while ((poz = str.indexOf(hedef, poz + 1)) != -1) {
  alert( poz );
}

Buna benzer baÅŸka bir metod daha bulunmaktadÄ±r. str.lastIndexOf(pos) bu metod karakter dizisinin sonundan baÅŸÄ±na doÄŸru arama yapar

BulduklarÄ±nÄ± da yine tersten yazar.

indexOfâ€™tan daha kullanÄ±ÅŸsÄ±zdÄ±r. if koÅŸulu olarak aÅŸaÄŸÄ±daki gibi kullanÄ±lamaz.

let str = "Bin berber bir berbere gel birader beraber bir berber dÃ¼kkanÄ± aÃ§alÄ±m demiÅŸ";

if (str.lastIndexOf("Bin")) {
    alert("Buldum!"); // Ã§alÄ±ÅŸmaz!
}

YukarÄ±daki alertâ€™Ã¼n Ã§alÄ±ÅŸmamasÄ±nÄ±n nedeni str.lastIndexOf("Bin")'in 0 dÃ¶ndÃ¼rmesidir. ( Bu baÅŸlangÄ±Ã§ta deÄŸeri bulmasÄ±na raÄŸmen) pozisyon 0 dÃ¶ndÃ¼ÄŸÃ¼nden if bunu false olarak algÄ±lar.

Bundan dolayÄ± -1â€™i aÅŸaÄŸÄ±daki gibi kontrol etmek gerekmektedir.

let str = "Bin berber bir berbere gel birader beraber bir berber dÃ¼kkanÄ± aÃ§alÄ±m demiÅŸ";

if (str.indexOf("Bin") != -1) {
    alert("Buldum"); // Åžimdi oldu!
}

Burada kullanÄ±lan [bitwise NOT] cambazlÄ±ÄŸÄ±dÄ±r. (https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Operators/Bitwise_Operators#Bitwise_NOT) ~ operatÃ¶rÃ¼. SayÄ±yÄ± 32-bit tamsayÄ±ya Ã§evirir.(EÄŸer ondalÄ±k bÃ¶lÃ¼mÃ¼ varsa bunu siler. TÃ¼m bitlerin binary(ikili) gÃ¶sterimlerini tersine Ã§evirir.

32-bit tam sayÄ±lar iÃ§in ~n tam olarak -(n+1)(IEEE-754 formatÄ±na gÃ¶re) demektir.

Ã–rneÄŸin:

alert( ~2 ); // -3,  -(2+1) demektir.
alert( ~1 ); // -2,  -(1+1) demektir.
alert( ~0 ); // -1,  -(0+1) demektir.
alert( ~-1 ); // 0,  -(-1+1) demektir.

GÃ¶rdÃ¼ÄŸÃ¼nÃ¼z Ã¼zere, ~n, sadece n == -1 olduÄŸu durumda 0 demektir.

Bundan dolayÄ± if( ~str.indexOf("...") ) anca indexOf -1 deÄŸilse true olur. DiÄŸer bir deyiÅŸle arandan deÄŸer bulunmuÅŸ demektir.

Daha kÄ±sa bir indexOf kullanÄ±mÄ± da mevcuttur:

let str = "Bin berber bir berbere gel birader beraber bir berber dÃ¼kkanÄ± aÃ§alÄ±m demiÅŸ";

if (~str.indexOf("Bin")) {
  alert( 'Buldum!' ); // Ã‡alÄ±ÅŸtÄ±
}

Genelde Ã§ok aÃ§Ä±k olmayan dil Ã¶zellikleri Ã¼zerinde cambazlÄ±k yapÄ±lmasÄ± Ã¶nerilmez. Fakat Ã¶zellikle bu kod parÃ§acÄ±ÄŸÄ± eski kodlarÄ±n iÃ§inde Ã§okÃ§a geÃ§mektedir. Bundan dolayÄ± en azÄ±ndan anlamalÄ±sÄ±nÄ±z.

HatÄ±rlatma: if (~str.indexOf(...)) â€œeÄŸer bulunursaâ€ diye okunurâ€¦

includes, startsWith, endsWith

Modern Ã¶zelliklerin iÃ§erisinde str.includes(substr, pos) true/false dÃ¶ndÃ¼ren bir metod bulunmaktadÄ±r.

EÄŸer sadece aradÄ±ÄŸÄ±nÄ±z karakterlerin var olup olmadÄ±ÄŸÄ±nÄ± kontrol etmek istiyorsanÄ±z ve pozisyonu sizin iÃ§in Ã¶nemli deÄŸilse bu metod kullanÄ±labilir:

alert( "Bin berber bir berbere gel birader beraber bir berber dÃ¼kkanÄ± aÃ§alÄ±m demiÅŸ".includes("Bin") ); // true

alert( "Merhaba".includes("GÃ¼le GÃ¼le") ); // false

str.includes un isteÄŸe baÄŸlÄ± ikinci argÃ¼manÄ± baÅŸlanacak pozisyonu belirtmenizi saÄŸlar:

alert( "birader".includes("ir") ); // true
alert( "birader".includes("ir", 3) ); // false, 3. pozisyondan sonra `ir` bulunmamaktadÄ±r.

AynÄ± ÅŸekilde str.startsWith ve str.endsWith metodlarÄ± sÃ¶yledikleri gibi, aranan karakter dizilerinin baÅŸlangÄ±Ã§ ve bitiÅŸlerine bakarlar.

alert( "birader".startsWith("bir") ); // true, "birader" "bir" ile baÅŸlar.
alert( "birader".endsWith("er") );   // true, "birader" "er" ile biter.

Alt karakter dizisi alma

Alt karakter dizisi alma JavaScriptâ€™te 3 metod ile yapÄ±lÄ±r: substring, substr ve slice

str.slice(basla [, bitir])

Karakter dizisinin baÅŸla ile baÅŸlayan bitir (dahil deÄŸil) ile bitirilen aralÄ±ktaki karakterleri alÄ±r.

Ã–rneÄŸin:

let str = "stringify";
alert( str.slice(0,5) ); // 'strin',  0 ile 5 arasÄ±ndaki alt karakter dizisi (5 dahil deÄŸil)
alert( str.slice(0,1) ); // 's', 0 ile 1, fakat 1 dahil deÄŸil, yani sadece 0'Ä±ncÄ± karakter.

EÄŸer ikinci bir argÃ¼man yoksa, slice karakter dizisinin sonuna kadar alÄ±r:

let str = "stringify";
alert( str.slice(2) ); // ringify, ikinci pozisyondan sonuna kadar.

basla/bitir iÃ§in negatif deÄŸerler kullanmakta mÃ¼mkÃ¼ndÃ¼r. Bu pozisyonun karakter bitiminden itibaren Ã§alÄ±ÅŸtÄ±ÄŸÄ± anlamÄ±na gelir.

let str = "stringify";

// saÄŸdan 4. pozisyondan baÅŸla ve yine saÄŸdan 1. pozisyona kadar al.
alert( str.slice(-4, -1) ); // gif

str.substring(basla [, bitir])

baÅŸla ile bitir arasÄ±ndaki karakterleri Ã§evirir.

Ã–rneÄŸin:

let str = "stringify";

// alt karakter dizisi iÃ§in aynÄ±dÄ±r.
alert( str.substring(2, 6) ); // "ring"
alert( str.substring(6, 2) ); // "ring"

// ...fakat slice iÃ§in farklÄ±dÄ±r:
alert( str.slice(2, 6) ); // "ring" (aynÄ±)
alert( str.slice(6, 2) ); // "" (boÅŸ karakter)

sliceâ€™a gÃ¶re farklÄ± olarak negatif sayÄ±lar 0 olarak hesaba katÄ±lÄ±r.

str.substr(baÅŸlangÄ±Ã§ [, length])

Verilen uzunluÄŸa baÄŸlÄ± olarak baÅŸlangÄ±Ã§â€™tan uzunluk kadar karakter alÄ±r.

DiÄŸer metoda gÃ¶re bu uzunluÄŸu belirtmemizi saÄŸlar. DiÄŸerleri pozisyonu belirtmemizi saÄŸlÄ±yordu.

let str = "stringify";
alert( str.substr(2, 4) ); // ring, 2. pozisyondan 4 karakter al.

Ä°lk karakter negatif olabilir. Sondan sayarak:

let str = "stringify";
alert( str.substr(-4, 2) ); // gi, 4. pozisyondan 2 karakter al.

KarÄ±ÅŸÄ±klÄ±ÄŸÄ± Ã¶nlemek adÄ±na metodlarÄ±n Ã¼zerinden geÃ§ersek:

method	selectsâ€¦	negatives
`slice(baÅŸlangÄ±Ã§, bitiÅŸ)`	`baÅŸlangÄ±Ã§`â€™dan `bitiÅŸ`â€™e kadar	negatif sayÄ±lar kullanÄ±labilir.
`substring(baÅŸlangÄ±Ã§, bitiÅŸ)`	`baÅŸlangÄ±Ã§`â€™dan `bitiÅŸ`â€™e kadar	negatif sayÄ±lar `0` demektir
`substr(baÅŸlangÄ±Ã§, uzunluk)`	`baÅŸlangÄ±Ã§`â€™dan `uzunluk` kadar karakter	negatif `baÅŸlangÄ±Ã§` kullanÄ±labilir

AslÄ±nda tamamÄ± iÅŸ gÃ¶rÃ¼r. Daha resmi dÃ¼zeyde bakÄ±lÄ±rsa: substr JavaScript Ã¶zellik tanÄ±mlarÄ±nda bulunmamaktadÄ±r. Fakat Annex Bâ€™ye gÃ¶re sadece tarayÄ±cÄ± tabanlÄ± Ã¶zellikler iÃ§erisinde bulunmaktadÄ±r. Bu da tarihi nedenlerden dolayÄ±dÄ±r. Bundan dolayÄ± tarayÄ±cÄ± Ã¼zerine yazmÄ±yorsanÄ±z. YazdÄ±ÄŸÄ±nÄ±z yere baÄŸlÄ± olarak bu kod hata verebilir. Fakat pratikte her yerde Ã§alÄ±ÅŸtÄ±ÄŸÄ± gÃ¶rÃ¼lebilir.

Yazar genelde slice kullanmaktadÄ±r.

Karakterlerin karÅŸÄ±laÅŸtÄ±rÄ±lmasÄ±

KarÅŸÄ±laÅŸtÄ±rmalar bÃ¶lÃ¼mÃ¼nden hatÄ±rlanacaÄŸÄ± Ã¼zere, karakterler birbirileri ile karakter karakter karÅŸÄ±laÅŸtÄ±rÄ±lÄ±rlar. Bu karÅŸÄ±laÅŸtÄ±rma alfabetik sÄ±raya gÃ¶re yapÄ±lmaktadÄ±r.

Buna raÄŸmen bazÄ± gariplikler de mevcuttur.

KÃ¼Ã§Ã¼k harf karakterler her zaman bÃ¼yÃ¼k harflerden bÃ¼yÃ¼ktÃ¼rler.
```
alert( 'a' > 'Z' ); // true
```
BÃ¶lgesel karakterler bu sÄ±ralamaya girmezler. Yani karÅŸÄ±laÅŸtÄ±rÄ±lamazlar.
```
alert( 'Ã–sterreich' > 'Zealand' ); // true
```
EÄŸer Ã¼lke isimlerini karÅŸÄ±laÅŸtÄ±rmak istiyorsanÄ±z bu garip sonuÃ§lara neden olabilir. Ã–rneÄŸin Zealand normalde Ã–sterreichâ€™ten sonra gelmesi beklenirken Ã¶nce gelir.

Ne olduÄŸunu anlamak iÃ§in JavaScript karakter dizilerini nasÄ±l tanÄ±mlÄ±yor buna bakmak lazÄ±m.

TÃ¼k karakter dizileri UTF-16 ile kodlanmÄ±ÅŸtÄ±r. Buna gÃ¶re: TÃ¼m karakterler sayÄ±sal olarak kodlanÄ±r. Bu koda gÃ¶re karakteri geri dÃ¶ndÃ¼recek Ã¶zel metodlar mevcuttur.

str.codePointAt(pos)

Verilen pozisyondaki karakterin kodunu dÃ¶ndÃ¼rÃ¼r:

// BÃ¼yÃ¼k kÃ¼Ã§Ã¼k harflerde farklÄ± kodlar dÃ¶ndÃ¼rÃ¼lÃ¼r.
alert( "z".codePointAt(0) ); // 122
alert( "Z".codePointAt(0) ); // 90

String.fromCodePoint(code)

SayÄ±sal deÄŸere gÃ¶re karakter dÃ¶ndÃ¼rÃ¼r.

alert( String.fromCodePoint(90) ); // Z

AyrÄ±ca \u ile birlikte kodun hexa decimal deÄŸerini kullanarak Unicode karakter eklemeniz de mÃ¼mkÃ¼ndÃ¼r:

// 90 hexa decimal sistemde 5a ya denk gelmektedir.
alert( '\u005a' ); // Z

65..220 arasÄ±nda sayÄ±sal deÄŸeri olan (Latin alfabesi ve bunun yanÄ±nda sayÄ±lar vs.) karakterleri ekrana basalÄ±m:

let str = '';

for (let i = 65; i <= 220; i++) {
  str += String.fromCodePoint(i);
}
alert( str );
// ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~Â€ÂÂ‚ÂƒÂ„
// Â¡Â¢Â£Â¤Â¥Â¦Â§Â¨Â©ÂªÂ«Â¬ÂÂ®Â¯Â°Â±Â²Â³Â´ÂµÂ¶Â·Â¸Â¹ÂºÂ»Â¼Â½Â¾Â¿Ã€ÃÃ‚ÃƒÃ„Ã…Ã†Ã‡ÃˆÃ‰ÃŠÃ‹ÃŒÃÃŽÃÃÃ‘Ã’Ã“Ã”Ã•Ã–Ã—Ã˜Ã™ÃšÃ›Ãœ

GÃ¶rdÃ¼ÄŸÃ¼nÃ¼z gibi Ã¶nce bÃ¼yÃ¼k harfler, sonrasÄ±nda birkaÃ§ Ã¶zel harf ve kÃ¼Ã§Ã¼k harfler ÅŸeklinde yazÄ±lmaktadÄ±r.

a > Z olduÄŸu yukarÄ±da aÃ§Ä±kÃ§a gÃ¶rÃ¼lmektedir.

Karakterler sayÄ±sal kodlarÄ± ile karÅŸÄ±laÅŸtÄ±rÄ±lmaktadÄ±r. Kod bÃ¼yÃ¼dÃ¼kÃ§e karakter de bÃ¼yÃ¼r denebilir. a iÃ§in yazÄ±lan kod (97) Z(90) kodundan bÃ¼yÃ¼ktÃ¼r.

TÃ¼k kÃ¼Ã§Ã¼k harfler bÃ¼yÃ¼k harflerden sonra gelir. Bundan dolayÄ± kÃ¼Ã§Ã¼k harflerin en kÃ¼Ã§Ã¼ÄŸÃ¼ bile bÃ¼yÃ¼k harflerin tamamÄ±ndan bÃ¼yÃ¼ktÃ¼r.
Ã– gibi karakterler alfabeden tamamen farklÄ± dÃ¼ÅŸÃ¼nmelidir. Bu karakterlerin kodlarÄ± kÃ¼Ã§Ã¼k harflerden bÃ¼yÃ¼ktÃ¼r.

DoÄŸru KarÅŸÄ±laÅŸtÄ±rma

Karakter karÅŸÄ±laÅŸtÄ±rmasÄ±nÄ± â€œdoÄŸruâ€ olarak yapmak gÃ¶rÃ¼ndÃ¼ÄŸÃ¼nden daha zordur. Ã‡Ã¼nkÃ¼ alfabe dilden dile farklÄ±lÄ±k gÃ¶stermektedir. AynÄ± gÃ¶rÃ¼nÃ¼ÅŸlÃ¼ harfler farklÄ± alfabelerde farklÄ± yerlerde yer alÄ±rlar.

TarayÄ±cÄ± hangi dil ile karÅŸÄ±laÅŸtÄ±racaÄŸÄ±nÄ± bilmeli.

Neyse ki tÃ¼m modern tarayÄ±cÄ±lar(IE10- ek kÃ¼tÃ¼phanelere gerek duymaktadÄ±r Intl.JS ) uluslararasÄ± dil standardÄ±na sahiptir ECMA 402.

Bu Ã¶zel bir metod ile farklÄ± dillerde karakterlerin birbirleri ile karÅŸÄ±laÅŸtÄ±rÄ±labilmesini saÄŸlar. KurallarÄ± ÅŸu ÅŸekildedir:

str.localeCompare(str2) in Ã§aÄŸÄ±rÄ±lmasÄ±:

EÄŸer dil kurallarÄ±na gÃ¶re str str2 den bÃ¼yÃ¼kse 1 dÃ¶ndÃ¼rÃ¼r.
EÄŸer str str2 den kÃ¼Ã§Ã¼kse -1 dÃ¶ndÃ¼rÃ¼r.
EÄŸer birbirleri ile eÅŸit ise 0 dÃ¶ndÃ¼rÃ¼r.

Ã–rneÄŸin:

alert( 'Ã–sterreich'.localeCompare('Zealand') ); // -1

AslÄ±nda bu metodun dÃ¶kÃ¼mantasyonâ€™da belirtilen iki tane argÃ¼manÄ± vardÄ±r. Bu argÃ¼manlar ile hangi dili kullanmak istediÄŸinizi veya "a" ile "aÌ"'nÄ±n aynÄ± ÅŸekilde davranÄ±lmasÄ±nÄ± isteyip istemediÄŸinizi belirtebilirsiniz.

Unicode ve Internaller.

Bu bÃ¶lÃ¼mde karakter dizilerinin daha derin Ã¶zelliklerine deÄŸinilecektir. Bu bilgiler emoji, hiyeroglif veya matematiksel ifadelerde yardÄ±mcÄ± olur.

EÄŸer bu konuda bir ihtiyacÄ±nÄ±z yoksa bu bÃ¶lÃ¼mÃ¼ atlayabilirsiniz.

Vekil Ã‡iftler

Ã‡oÄŸu sembol 2-byte kod ile tanÄ±mlanÄ±r. Ã‡oÄŸu Avrupa dili, sayÄ±lar ve Ã§oÄŸu hiyeroglifler iki byte ile tanÄ±mlanabilir.

Fakat iki byte 65536 sembolÃ¼ tanÄ±mlayabilir ve tÃ¼m semboller iÃ§in bu yeterli deÄŸildir. Bundan dolayÄ± nadir semboller bir Ã§ift 2-byteâ€™lÄ±k karakter ile tanÄ±mlanÄ±r. Buna vekil Ã§iftler veya â€œsurrogate pairâ€ adÄ± verilir.

BÃ¶yle sembollerin uzunluÄŸu 2â€™dir:

alert( 'ð’³'.length ); // 2, Matematiksel komut bÃ¼yÃ¼k X
alert( 'ðŸ˜‚'.length ); // 2, SevinÃ§ten aÄŸlama emojisi
alert( 'ð©·¶'.length ); // 2, nadir bir Ã‡in hiyeroglifi

Bu vekil Ã§iftler JavaScript yaratÄ±ldÄ±ÄŸÄ±nda meydanda yoktu, bundan dolayÄ± dil tarafÄ±ndan doÄŸru olarak iÅŸlenemez.

Tek bir karakter olmasÄ±na raÄŸmen length (uzunluk) 2 gÃ¶stermektedir.

String.fromCodePoint ve str.codePointAt az bilinen ve bu ikili karakterlerle uÄŸraÅŸan iki metoddur. Dile entegreleri yakÄ±n zamanda gerÃ§ekleÅŸti. Bundan Ã¶nce sadece String.fromCharCode ve str.charCodeAt bulunmaktadÄ±r. Bu metodlar aslÄ±nda fromCodePoint/codePointAt ile aynÄ±dÄ±r fakat ikili karakterler ile Ã§alÄ±ÅŸmamaktadÄ±rlar.

Ã–rneÄŸin sembolÃ¼n alÄ±nmasÄ± biraz karmaÅŸÄ±ktÄ±r, Ã§Ã¼nkÃ¼ bu Ã§iftler iki karakterden oluÅŸmaktadÄ±rlar.

alert( 'ð’³'[0] ); // garip semboller...
alert( 'ð’³'[1] ); // ...her biri ikilinin parÃ§alarÄ±

Dikkat ederseniz Ã§iftli karakterler tek baÅŸlarÄ±na bir ÅŸey ifade etmezler. Yani yukarÄ±daki Ã¶rnekler aslÄ±nda hiÃ§bir iÅŸe yaramaz.

Teknik olarak, bu Ã§iftler kodlarÄ±na bakÄ±larak ayÄ±rt edilebilir: EÄŸer bir karakter 0xd800..0xdbff aralÄ±ÄŸÄ±nda ise bu Ã§iftin ilk karakteri demektir. Ä°kinci karakter ise 0xd800..0xdbff aralÄ±ÄŸÄ±nda olmalÄ±dÄ±r. Bu aralÄ±klar Ã¶zel olarak Ã§iftler iÃ§in ayrÄ±lmÄ±ÅŸtÄ±r.

YukarÄ±daki duruma gÃ¶re:

// charCodeAt Ã§iftlere uygun deÄŸildir, bundan dolayÄ± sadece kodlar verilir.

alert( 'ð’³'.charCodeAt(0).toString(16) ); // d835, 0xd800 ile 0xdbff arasÄ±nda
alert( 'ð’³'.charCodeAt(1).toString(16) ); // dcb3, 0xdc00 ile 0xdfff arasÄ±nda

SÄ±ralÄ± eriÅŸim ( Iterable ) bÃ¶lÃ¼mÃ¼nde bu Ã§iftler ile ilgili daha fazla bilgi bulabilirsiniz. Muhtemelen bunun ile ilgili kÃ¼tÃ¼phaneler de vardÄ±r, fakat burada Ã¶nerecek kadar meÅŸhur olan yok henÃ¼z.

Aksan iÅŸaretleri ve normalleÅŸtirme

Ã‡oÄŸu dilde temel karakterlerin altÄ±na veya Ã¼stÃ¼nÃ¼ sembol eklenerek oluÅŸturulmuÅŸ yeni karakterler mevcuttur.

Ã–rneÄŸin a, Ã Ã¡Ã¢Ã¤Ã£Ã¥Ä ÅŸeklinde karakterlere sahiptir. Bu birleÅŸik karakterler UTF-16 tablosunda kendine has kodlara sahiptir. Hepsi deÄŸil tabi fakat Ã§oÄŸu birleÅŸik karakter bu tabloda yer alÄ±r.

Elle bu karakterleri birleÅŸtirmek iÃ§in, UTF-16 bazÄ± Unicode karakter kullanmamÄ±za olanak verir. BÃ¶ylece temel karakterin Ã¼zerine bir veya daha fazla â€œiÅŸaretâ€ eklenerek yeni bir karakter â€œÃ¼retilebilirâ€

Ã–rneÄŸin, S harfinin Ã¼stÃ¼ne â€œnoktaâ€ eklemek isterseniz \u0307 kullanabilirsiniz. Bunu kullandÄ±ÄŸÄ±nÄ±zda SÌ‡ elde etmiÅŸ olursunuz.

alert( 'S\u0307' ); // SÌ‡

EÄŸer bu karakterin Ã¼stÃ¼ne veya altÄ±na farklÄ± iÅŸaretler eklemek istiyorsanÄ±z gerekli karakterleri istediÄŸiniz gibi ekleyebilirsiniz.

Ã–rneÄŸin, eÄŸer â€œaÅŸaÄŸÄ± noktaâ€ kodunu ( \u0323) eklerseniz, â€œSâ€™in altÄ±na ve Ã¼stÃ¼ne noktaâ€ demiÅŸ olursunuz ve ÅŸu ÅŸekilde bir karakter elde edersiniz: SÌ‡Ì£

Ã–rneÄŸin:

alert( 'S\u0307\u0323' ); // SÌ‡Ì£

BÃ¶ylece Ã§ok farklÄ± karakterler elde etmek mÃ¼mkÃ¼ndÃ¼r, fakat bu bir probleme neden olmaktadÄ±r: iki karakter gÃ¶rÃ¼nÃ¼ÅŸte birbiri ile aynÄ± olabilir, fakat iki farklÄ± Unicodeâ€™a sahip olabilir.

Ã–rneÄŸin:

alert( 'S\u0307\u0323' ); // SÌ‡Ì£, S + Ã¼st nokta + alt nokta
alert( 'S\u0323\u0307' ); // SÌ‡Ì£, S + alt nokta + Ã¼st nokta

alert( 'S\u0307\u0323' == 'S\u0323\u0307' ); // false

Bunu Ã§Ã¶zebilmek iÃ§in â€œUnicode normalleÅŸtirmeâ€ algoritmalarÄ± mevcuttur. Bu karakterleri tek bir â€œnoramâ€ forma Ã§evirir.

str.normalize() ÅŸeklinde uygulamasÄ± yapÄ±lmaktadÄ±r.

alert( "S\u0307\u0323".normalize() == "S\u0323\u0307".normalize() ); // true

Bizim durumumuzda normalize() fonksiyonu aslÄ±nda 3 karakteri tek bir karakter haline getirir: \u1e68 ( alt ve Ã¼st nokta ile S harfi)

alert( "S\u0307\u0323".normalize().length ); // 1

alert( "S\u0307\u0323".normalize() == "\u1e68" ); // true

GerÃ§ekte bu durumla Ã§ok nadir karÅŸÄ±laÅŸÄ±lÄ±r. Bu karakter bile SÌ‡Ì£ oldukÃ§a â€œyaygÄ±nâ€ olduÄŸundan, UTF-16 standart tablosu iÃ§erisinde yer almaktadÄ±r.

EÄŸer normalizasyon kurallarÄ±nÄ± ve tiplerini daha derinlemesine Ã¶ÄŸrenmek istiyorsanÄ±z Unicode Normalization Forms adresinden inceleyebilirsiniz. Pratikte yukarÄ±da verilen bilgiler yeterli olacaktÄ±r.

Ã–zet

3 tip tÄ±rnak bulunmaktadÄ±r. â€œ`â€ iÅŸareti ile birkaÃ§ satÄ±rdan oluÅŸan karakter dizisi yazmak mÃ¼mkÃ¼ndÃ¼r.
JavaScriptâ€™te karakterler UTF-16 ile kodlanmÄ±ÅŸtÄ±r.
\n gibi Ã¶zel karakterler veya \u.. ile Unicode kullanÄ±labilir.
Karakteri almak iÃ§in: [] kullanÄ±lÄ±r.
Alt karakter kÃ¼mesi almak iÃ§in slice veya substring kullanÄ±lÄ±r.
KÃ¼Ã§Ã¼k/bÃ¼yÃ¼k harf deÄŸiÅŸimi iÃ§in: toLowerCase/toUpperCase.
Alt karakter dizisi aramak iÃ§in : indexOf veya includes/startsWith/endsWith kullanÄ±labilir.
Karakterleri dile gÃ¶re karÅŸÄ±laÅŸtÄ±rmak iÃ§in localceCompare kullanÄ±labilir. DiÄŸer tÃ¼rlÃ¼ karakterler kodlarÄ±na gÃ¶re karÅŸÄ±laÅŸtÄ±rÄ±lÄ±rlar.

Bunun yanÄ±nda karakter dizileri iÃ§in daha baÅŸka yardÄ±mcÄ± metodlar bulunmaktadÄ±r:

str.trim() â€“ baÅŸlangÄ±Ã§ ve bitiÅŸteki boÅŸluklarÄ± siler.
str.repeat(n) â€“ strâ€™yi istendiÄŸi kadar tekrar eder.
â€¦ Daha fazlasÄ± iÃ§in manual adresine bakabilirsiniz.

Karakter dizileri bunun yanÄ±nda arama/deÄŸiÅŸtirme veya regular expression iÃ§in metodlar barÄ±ndÄ±rmaktadÄ±r. Fakat bu konular ayrÄ± bÃ¶lÃ¼mleri hak etmektedir. Bu konulara ilerleyen bÃ¶lÃ¼mlerde dÃ¶nÃ¼lecektir.

GÃ¶revler

Ä°lk karakteri bÃ¼yÃ¼k harf yapma

ucFirst(str) adÄ±nda bir fonksiyon yazÄ±n bu fonksiyon verilen str deÄŸiÅŸkeninin ilk karakterini bÃ¼yÃ¼k harf yapÄ±p dÃ¶nsÃ¼n, Ã¶rneÄŸin:

ucFirst("ahmet") == "Ahmet";

Testler ile korunaklÄ± olan aÃ§.

Ä°lk karakteri â€œdeÄŸiÅŸtiremeyizâ€ Ã§Ã¼nkÃ¼ JavaScriptâ€™te karakter dizileri deÄŸiÅŸtirilemez.

Fakat var olan ile yeni bir karakter dizisi yapmak ve ilk karakteri bÃ¼yÃ¼k baÅŸlamak mÃ¼mkÃ¼ndÃ¼r:

let yeniDizi = str[0].toUpperCase() + str.slice(1);

Burada kÃ¼Ã§Ã¼k bir problem var. EÄŸer str boÅŸ ise, str[0] undefined olur ve hata dÃ¶ner.

Bunun iki tÃ¼rlÃ¼ Ã§Ã¶zÃ¼mÃ¼ bulunmaktadÄ±r.

str.charAt(0), kullanarak ilk satÄ±rdaki karakteri kontrol etmek.
BoÅŸ karakterler iÃ§in kontrol yazmak

Ä°kinci tÃ¼rÃ¼ ise:

function ucFirst(str) {
  if (!str) return str;

  return str[0].toUpperCase() + str.slice(1);
}

alert( ucFirst("ahmet") ); // Ahmet

          function ucFirst(str) {
  if (!str) return str;

  return str[0].toUpperCase() + str.slice(1);
}
        

Ã‡Ã¶zÃ¼mÃ¼ testler korunaklÄ± alanda olacak ÅŸekilde aÃ§.

Spam kontrolÃ¼

checkSpam(str) adÄ±nda bir fonksiyon yazÄ±n ve bu eÄŸer str â€˜viagraâ€™ veya â€˜XXXâ€™ gibi deÄŸerler alÄ±rsa true diÄŸer hallerda false dÃ¶ndermesi lazÄ±m.

Fonksiyon bÃ¼yÃ¼k kÃ¼Ã§Ã¼k harf duyarsÄ±z olmasÄ± gerekmektedir:

          checkSpam('buy ViAgRA now') == true
checkSpam('free xxxxx') == true
checkSpam("innocent rabbit") == false
        

Testler ile korunaklÄ± olan aÃ§.

BÃ¼yÃ¼k kÃ¼Ã§Ã¼k harf duyarsÄ±z yapabilmek iÃ§in Ã¶nce tÃ¼m harfleri kÃ¼Ã§Ã¼k harfe Ã§evirebilir ve sonra arayabilirsiniz:

function checkSpam(str) {
  let lowerStr = str.toLowerCase();

  return lowerStr.includes('viagra') || lowerStr.includes('xxx');
}

alert( checkSpam('buy ViAgRA now') );
alert( checkSpam('free xxxxx') );
alert( checkSpam("innocent rabbit") );

          function checkSpam(str) {
  let lowerStr = str.toLowerCase();

  return lowerStr.includes('viagra') || lowerStr.includes('xxx');
}
        

Ã‡Ã¶zÃ¼mÃ¼ testler korunaklÄ± alanda olacak ÅŸekilde aÃ§.

Metin kesme

truncate(str, maxlength) fonksiyonu strâ€™nin uzunluÄŸunu kontrol eder. EÄŸer maxlengthâ€™den uzunsa str nin sonunu "..." ile bitirir ve uzunluÄŸunu maxlengthâ€™e kadar getirir.

Fonksiyonun sonucunda eÄŸer gerekliyse metin kesilmelidir.

Ã–rneÄŸin:

          truncate("Size bu konuda sÃ¶ylemek istediÄŸim ÅŸey:", 20) = "Size bu konuda sÃ¶..."

truncate("Merhaba!", 20) = "Merhaba!"

Testler ile korunaklÄ± olan aÃ§.

Maksimum uzunluk maxlength olacaÄŸÄ±ndan dolayÄ± ... iÃ§in de yer ayÄ±rmakta fayda var.

Note that there is actually a single unicode character for an ellipsis. Thatâ€™s not three dots.

function truncate(str, maxlength) {
  return (str.length > maxlength) ?
    str.slice(0, maxlength - 3) + '...' : str;
}

          function truncate(str, maxlength) {
  return (str.length > maxlength) ?
    str.slice(0, maxlength - 1) + 'â€¦' : str;
}
        

Ã‡Ã¶zÃ¼mÃ¼ testler korunaklÄ± alanda olacak ÅŸekilde aÃ§.

Para iÅŸaretlerini metinden Ã§Ä±karÄ±n

Formda "$120" Ã¼cret bulunmaktadÄ±r. Ã–nce dolar iÅŸareti ardÄ±ndan sayÄ± gelmektedir.

Ã–yle bir fonksiyon yazÄ±n ki extractCurrencyValue(str) bu fonksiyon sadece sayÄ±sal deÄŸeri dÃ¶ndersin.

Ã–rnek:

alert( extractCurrencyValue('$120') === 120 ); // true

Testler ile korunaklÄ± olan aÃ§.

          function extractCurrencyValue(str) {
  return +str.slice(1);
}
        

Ã‡Ã¶zÃ¼mÃ¼ testler korunaklÄ± alanda olacak ÅŸekilde aÃ§.

EÄŸitim haritasÄ±

Yorumlar

yorum yapmadan Ã¶nce lÃ¼tfen okuyun...

Karakter Dizisi - Strings

TÄ±rnak Ä°ÅŸaretleri

Ã–zel Karakterler

Karakter dizisi uzunluÄŸu

Karakterlere eriÅŸim

Karakterler tanÄ±mlandÄ±ktan sonra deÄŸiÅŸtirilemezler ( immutable )

Harf iÅŸlemleri

Karakter dizisi iÃ§inde baÅŸka bir karakter arama

str.indexOf

includes, startsWith, endsWith

Alt karakter dizisi alma

Karakterlerin karÅŸÄ±laÅŸtÄ±rÄ±lmasÄ±

DoÄŸru KarÅŸÄ±laÅŸtÄ±rma

Unicode ve Internaller.

Vekil Ã‡iftler

Aksan iÅŸaretleri ve normalleÅŸtirme

Ã–zet

GÃ¶revler

Ä°lk karakteri bÃ¼yÃ¼k harf yapma

Spam kontrolÃ¼

Metin kesme

Para iÅŸaretlerini metinden Ã§Ä±karÄ±n

Yorumlar

BÃ¶lÃ¼m

Ders menÃ¼sÃ¼