Anda kini dapat menggunakan
Intl.Segmenter
untuk segmentasi teks sensitif lokalitas guna memisahkan string menjadi kata, kalimat,
atau graf.
Banyak bahasa non-Latin, seperti China dan Jepang,
tidak menggunakan spasi untuk memisahkan kata. Oleh karena itu, penggunaan metode split()
JavaScript pada spasi kosong untuk memisahkan teks menjadi kata akan menampilkan hasil yang salah.
Saat membuat objek Intl.Segmenter
baru dengan
konstruktor Intl.segmenter()
,
teruskan locale
dan opsi termasuk granularity
, yang dapat
memiliki nilai "grapheme"
, "word"
, atau "sentence"
. Contoh berikut
membuat objek Intl.Segmenter
baru untuk bahasa Jepang, memisahkan kata.
const segmenter = new Intl.Segmenter('ja-JP', { granularity: 'word' });
Memanggil metode
segment()
pada objek Intl.Segmenter
dengan string teks
akan menampilkan iterable:
const segments = segmenter.segment(str);
console.table(Array.from(segments));
Baca Menggunakan Intl.Segmenter API di blog Polypane untuk mendapatkan tutorial yang sangat baik tentang cara menggunakan fitur ini.
Segmentasi Teks Internasional dengan Intl.Segmenter di JavaScript
memiliki contoh lainnya, termasuk cara menggunakan Intl.Segmenter
dengan emoji.