अब जगह के हिसाब से संवेदनशील टेक्स्ट सेगमेंटेशन के लिए, Intl.Segmenter
का इस्तेमाल किया जा सकता है. इसकी मदद से, स्ट्रिंग को शब्दों, वाक्यों या ग्राफ़िक में बांटा जा सकता है.
कई गैर-लैटिन भाषाएं, जैसे कि चीनी और जापानी,
शब्दों को अलग करने के लिए स्पेस का इस्तेमाल नहीं करती हैं. इसलिए, टेक्स्ट को शब्दों में बांटने के लिए, खाली सफ़ेद जगह पर JavaScript split()
तरीके का इस्तेमाल करने से गलत नतीजे मिलेंगे.
Intl.segmenter()
कंस्ट्रक्टर की मदद से नया Intl.Segmenter
ऑब्जेक्ट बनाते समय, locale
और granularity
वाले विकल्प पास करें. इनमें "grapheme"
, "word"
या "sentence"
की वैल्यू हो सकती हैं. नीचे दिए गए उदाहरण में, जैपनीज़ के लिए एक नया Intl.Segmenter
ऑब्जेक्ट बनाया गया है, जिसे शब्दों को छोटे-छोटे शब्दों में बांटा गया है.
const segmenter = new Intl.Segmenter('ja-JP', { granularity: 'word' });
किसी Intl.Segmenter
ऑब्जेक्ट पर,
segment()
तरीके को टेक्स्ट की स्ट्रिंग के साथ कॉल करने से
दोहराया जा सकने वाला डेटा मिलता है:
const segments = segmenter.segment(str);
console.table(Array.from(segments));
इस सुविधा को इस्तेमाल करने का तरीका जानने के लिए, Polypane ब्लॉग पर Intl.segmenter API का इस्तेमाल करना पढ़ें.
JavaScript में Intl.segmenter की मदद से, अंतरराष्ट्रीय टेक्स्ट सेगमेंटेशन
में कई और उदाहरण मिलते हैं. इनमें इमोजी के साथ Intl.Segmenter
को इस्तेमाल करने का तरीका भी शामिल है.