Corpora

/ˈkɔːr.pər.ə/

कॉर्पोरा (कॉर्पस का बहुवचन); पाठ/भाषा-डेटा के संग्रह

Origin & History

Plural of corpus, from Latin corpus meaning “body”; in modern scholarship used for a “body of texts.”

‘कॉर्पस’ (corpus) का बहुवचन; लैटिन corpus से, अर्थ “शरीर”; आधुनिक अध्ययन में “पाठों/सामग्री का निकाय (संग्रह)” के अर्थ में प्रयुक्त।

Definition

Corpora are multiple corpora—organized collections of texts or language data gathered and stored for study (e.g., to analyze word usage, grammar patterns, or train language models).

कॉर्पोरा, ‘कॉर्पस’ का बहुवचन है—पाठों या भाषा-डेटा के सुव्यवस्थित संग्रह जिन्हें अध्ययन के लिए एकत्र और संग्रहीत किया जाता है (जैसे शब्द-प्रयोग, व्याकरणिक पैटर्न का विश्लेषण, या भाषा मॉडलों को प्रशिक्षित करना)।

Parts of Speech

Noun (plural):
Researchers compared two corpora to see how the word is used in different decades.
शोधकर्ताओं ने अलग-अलग दशकों में शब्द के प्रयोग को देखने के लिए दो कॉर्पोरा की तुलना की।

Usage Examples

The linguist built several corpora from newspapers, novels, and social media posts.
Large corpora help identify common collocations and patterns of usage.
Modern NLP systems are often trained on massive text corpora.
The project released parallel corpora to support machine translation research.

Synonyms

Text collections Datasets Language databases Text databases Repositories

Antonyms

Single text Individual document

Related Forms

Noun
Corpus (singular) / Corpora (plural) / Corpus linguistics / Corpus-based / Corpus-driven
Adjective
Corpus-based / Corpus-driven

Idioms & Phrases

Build a corpus
कॉर्पस/पाठ-संग्रह तैयार करना
Corpora-based analysis
कॉर्पोरा-आधारित विश्लेषण
Use corpora to
…के लिए कॉर्पोरा का उपयोग करना