N-gram
এন-গ্রাম (পরপর nটি এককের ধারাবাহিক ক্রম/অনুক্রম)
Origin & History
Coined in the mid-to-late 20th century in computational linguistics/statistics from n (a variable denoting number) + gram (by analogy with forms like telegram/diagram and terms such as bigram/trigram).
২০শ শতকের মধ্যভাগ থেকে শেষভাগে কম্পিউটেশনাল ভাষাবিজ্ঞান/পরিসংখ্যানে n (সংখ্যা বোঝানো চলক) + gram (telegram/diagram-এর মতো গঠনের অনুকরণে এবং bigram/trigram-এর মতো পরিভাষার ধারায়) থেকে গঠিত শব্দ।
Definition
An n-gram is a consecutive run of n units (e.g., characters, syllables, words, or tokens) taken from a larger sequence; it is widely used to model language patterns, estimate probabilities, and build features for tasks like text prediction, search, and classification.
n-gram হলো বড় কোনো ক্রম (যেমন লেখা বা কথ্য ভাষা) থেকে নেওয়া পরপর nটি একক (যেমন অক্ষর, শব্দাংশ, শব্দ বা টোকেন)-এর ধারাবাহিক অংশ; এটি ভাষার ধরণ মডেল করা, সম্ভাবনা নির্ণয় করা এবং টেক্সট প্রেডিকশন, সার্চ, ও শ্রেণিবিন্যাসের মতো কাজে ফিচার তৈরিতে ব্যাপকভাবে ব্যবহৃত হয়।