UTF-8
UTF-8 (Unicode Transformation Format 8-bit)
Encoding karakter dominan untuk web, mampu merepresentasikan setiap karakter dalam standar Unicode menggunakan satu hingga empat byte per karakter sambil tetap kompatibel dengan ASCII.
Detail Teknis
UTF-8 adalah encoding lebar variabel: karakter ASCII (U+0000 hingga U+007F) menggunakan satu byte yang identik dengan nilai ASCII-nya, menjadikan teks ASCII apa pun sebagai UTF-8 yang valid. Dua byte mencakup Latin, Yunani, Sirilik, dan Arab (U+0080-U+07FF), tiga byte mencakup sebagian besar karakter CJK (U+0800-U+FFFF), dan empat byte menangani emoji dan skrip langka (U+10000-U+10FFFF). Lebih dari 98% halaman web menggunakan UTF-8. BOM (Byte Order Mark, EF BB BF) bersifat opsional dan umumnya tidak disarankan kecuali dalam konteks Windows.
Contoh
```javascript
// UTF-8: file processing example
const file = document.getElementById('fileInput').files[0];
const reader = new FileReader();
reader.onload = (e) => {
const data = e.target.result;
console.log(`Loaded: ${file.name} (${file.size} bytes)`);
};
reader.readAsArrayBuffer(file);
```