دوره فشرده (کرش کورس) TextMining

معرفی دوره

در عصر و زمانی زندگی می کنیم که روز به روز بر سرعت رشد داده های تولید شده افزوده می شود. طبق آخرین بررسی ها بیش از 90 درصد دیتا موجود محصول 2 سال اخیر است.

براساس تحقیق صورت گرفته توسط IDC، حجم دیتای خام جهان که در سال 2012 بیش از 2596 اگزابایت بود تا سال 2017 بالغ بر 7235 اگزابایت می رسد.

در این میان شرکت، سازمان و کشوری موفق است که بتواند این حجم عظیم داده ها را تحلیل نماید و دانش لازم را از آن استخراج نموده و دانش برآمده از این فرآیند را در سیستم های تصمیم گیر هوشمند به کار برد.

در این دوره افراد شرکت کننده با متن کاوی، نحوه آماده سازی داده ها برای تحلیل داده ها و سپس با الگوریتم های خوشه بندی و طبقه بندی داده ها  آشنا می شوند.

ابزار مورد استفاده در این دوره زبان برنامه نویسی پایتون و ماژول های مورد استفاده NLTK و scikit-learn می باشد.

برای شرکت در دوره انتخابی پیش ثبت نام کنید.

سرفصل های دوره

Materials:

  • An Introduction to Natural Language Toolkit (NLTK)
  • An Introduction to Machine Learning with scikit-learn
  • Prepare Data for Text Mining
  • Tokenization, Stop Words Removal, Lemmatisation
  • Prepare Vector Space Model
  • Clustering Algorithm like k-Means
  • Classification Algorithm like KNN, Niave Bayes

مخاطبان دوره

دانشجویان علوم تصمیم و مهندسی دانش و علاقندان به دانش داده کاوی

پیش نیاز: تجربه برنامه نویسی و آشنائی مقدماتی با زبان پایتون

زمان بندی دوره

مدت زمان: 8 ساعت – 1 جلسه

روز و ساعت برگزاری: پنج شنبه و یا جمعه

از 08:00 الی 16:00

مدرس دوره