Preloader

Query +91 (0)484 - 2972720

Basic Horizontal Scrolling

എം ജി ബിരുദ ഏകജാലകം 2026: ഓൺലൈൻ രജിസ്‌ട്രേഷൻ ആരംഭിച്ചു. എം ജി സർവ്വകലാശാലയോട് അഫിലിയേറ്റ് ചെയ്തിട്ടുള്ള സ്വയംഭരണ കോളേജുകൾ ഒഴികെയുള്ള ആർട്സ് ആൻഡ് സയൻസ് കോളേജുകളിലെ ഓണേഴ്‌സ് ബിരുദ പ്രോഗ്രാമുകളിലേക്കും സർവ്വകലാശാല ഗ്രാജ്യുവേറ്റ് സ്‌കൂളിലെ 4+1 പ്രോഗ്രാമിലേക്കുമുള്ള പ്രവേശനത്തിനായുള്ള ഓൺലൈൻ രജിസ്‌ട്രേഷൻ ആരംഭിച്ചു. നിലവിൽ പ്ളസ് 2 പരീക്ഷാഫലം വന്നവർക്കു മാത്രമേ ഏകജാലക സംവിധാനത്തിലൂടെ അപേക്ഷിക്കാൻ സാധിക്കുകയുള്ളൂ. പ്ളസ് 2 പരീക്ഷാഫലം കാത്തിരിക്കുന്നവർ ഇപ്പോൾ അപേക്ഷിക്കേണ്ടതില്ല.

Basic Horizontal Scrolling

Siena College of Professional Studies - An ISO 9001:2015 Certified Institution, NAAC Accredited with Grade B++ (CGPA of 2.85) - Approved by Govt. of Kerala & AICTE. Owned and Administered by Aquinas Educational and Charitable Trust

NATURAL LANGUAGE PROCESSING

CERTIFICATE COURSE IN NATURAL LANGUAGE PROCESSING

 

Programme Code: SCPS/CS/NLP/2022-23

Class: I BSc IT      Total Hours: 36 hours          Modules:  5

SYLLABUS

 

UNIT 1 ( 6 hours)

Introduction to NLP – Various stages of NLP –The Ambiguity of Language: Why NLP Is DifficultParts of Speech: Nouns and Pronouns, Words: Determiners and adjectives, verbs, Phrase Structure. Statistics Essential Information Theory : Entropy, perplexity, The relation to language, Cross- NLTK, Python 3 and the Jupyter Notebook

UNIT II (5 hours)

Textual Sources and Formats 1: “What’s in a Text?”- Sources 2: APIs, Social Media, Web Scraping- Building your Corpus

UNIT III (7 hours)

Tokenization, N-grams and Scriptio continua- Stemming and Lemmatization, Synsets and Hypernyms- Tokenizing your Corpus- POS Tagging and Stopwords- Text “Features” and TF-IDF Classification- The “Words” in a “Text”

UNIT IV (6 hours)

Named Entity Recognition (NER)- Sentiment Analysis- What Kind of Text is it?(Machine Learning Approaches to Textual Data)- Topic Modeling Basics- Topic Modeling: Strengths, Weaknesses, Correlations-

UNIT V (6 hours)

Stylometry & Stylometric Analysis- Dendograms, PCA scatterplots & k-means- Plotting the Text, Finding the Plot- Document Clustering and Word Vectors- Doc2vec, Word2vec- Advanced Vector Analyses

 

If you Have Any Query Call Us On +91 (0)484 - 2972720