Objek Intl.Segmenter sekarang menjadi bagian dari Dasar Pengukuran

Anda kini dapat menggunakan Intl.Segmenter untuk segmentasi teks sensitif lokalitas guna memisahkan string menjadi kata, kalimat, atau graf.

Dukungan Browser

  • 87
  • 87
  • 125
  • 14.1

Sumber

Banyak bahasa non-Latin, seperti China dan Jepang, tidak menggunakan spasi untuk memisahkan kata. Oleh karena itu, penggunaan metode split() JavaScript pada spasi kosong untuk memisahkan teks menjadi kata akan menampilkan hasil yang salah.

Saat membuat objek Intl.Segmenter baru dengan konstruktor Intl.segmenter(), teruskan locale dan opsi termasuk granularity, yang dapat memiliki nilai "grapheme", "word", atau "sentence". Contoh berikut membuat objek Intl.Segmenter baru untuk bahasa Jepang, memisahkan kata.

const segmenter = new Intl.Segmenter('ja-JP', { granularity: 'word' });

Memanggil metode segment() pada objek Intl.Segmenter dengan string teks akan menampilkan iterable:

const segments = segmenter.segment(str);
console.table(Array.from(segments));

Baca Menggunakan Intl.Segmenter API di blog Polypane untuk mendapatkan tutorial yang sangat baik tentang cara menggunakan fitur ini.

Segmentasi Teks Internasional dengan Intl.Segmenter di JavaScript memiliki contoh lainnya, termasuk cara menggunakan Intl.Segmenter dengan emoji.