سالیان سال است که پایگاه های داده ای رابطه ای و یا همان RDMS ها برای ذخیره داده های ساختار یافته مورد استفاده قرار می گیرند. این داده ها درون جداولی که نشان از یک رابطه دارد، قرار می گیرند. زبان پرس و جوس SQL هم برای دسترسی به این داده ها مورد استفاده قرار می گیرد.
در سالیان اخیر با سیستم های مواجه شده ایم که طبیعت آنان به گونه ای است که از مدل رابطه ای پیروی نمی کنند. این سیستم ها که مشخصه اصلی آن حجم بالای داده ای است که هر لحظه تولید می شود ما را برآن می دارد تا از مدلی استفاده کنیم که بتواند در کنار نگهداری حجم عظیم داده ها، دسترسی به داده ها را با سرعت بالا برای ما امکان پذیر سازد.
پایگاه های داده ای عظیم همانند فیس بوک، توئیتر، ویکی پدیا، آمازون، گوگل و یاهو از این مدل بهره می جویند.
استفاده از NoSQL محدود به شرکت های با ماهیت نرم افزاری نیست. امروزه در هواشناسی، اوقیانوس شناسی، پیش بینی شرائط جوی و بیولوژی از این مدل برای نگهداری داده ها استفاده می شود.
در این دوره در ابتدا با موانع و مشکلات پایگاه داده ای رابطه ای آشنا می شویم و بعد با قابلیت ها و توانمندی های پایگاه های داده ای NoSQL همانند Redis، BDB، MongoDB و CouchDB آشنا می شویم.
بسیاری از برنامهنویسان در کشور ما یا تجربه کار گروهی را ندارند و یا اگر دارند با روال درست و ابزارهای مورد نیاز آن آشنا نیستند. از سوی دیگر انجام درست و راهبری پروژه های نرم افزاری بزرگ بدون این پیش نیاز ها امکان پذیر نیست و محکوم به شکست است. در سالهای اخیر شماری از شرکتها آموختهاند تا حدی از این ابزار استفاده کنند ولی متاسفانه تجربه ما نشان می دهد در این مورد راه درست پیموده نشده است به این معنا که یا دچار استفاده بیش از حد و یا به قول خودمان آفتابه لگن هفت دست شدهاند و یا برعکس از ابزار های درست و کافی استفاده نکردهاند و نحوه استفاده از ابزار را نیاموختهاند.
یکی از دلایل کامیاب نشدن این گروه ها و افراد در این گونه موارد نداشتن شناخت کافی از ابزارها و مقاومت افراد تیم به دلیل همین شناخت کم است. در این دوره تلاش ما بر این است که شما را با همه روشهای مدرن و متداول و ابزارهای مربوط به آنها آشنا کنیم و چیزی ناگفته نگذاریم و سپس با راهنمایی ما ابزار مورد نیاز خود را انتخاب کنید.
در عصر و زمانی زندگی می کنیم که روز به روز بر سرعت رشد داده های تولید شده افزوده می شود. طبق آخرین بررسی ها بیش از 90 درصد دیتا موجود محصول 2 سال اخیر است.
براساس تحقیق صورت گرفته توسط IDC، حجم دیتای خام جهان که در سال 2012 بیش از 2596 اگزابایت بود تا سال 2017 بالغ بر 7235 اگزابایت می رسد.
در این میان شرکت، سازمان و کشوری موفق است که بتواند این حجم عظیم داده ها را تحلیل نماید و دانش لازم را از آن استخراج نموده و دانش برآمده از این فرآیند را در سیستم های تصمیم گیر هوشمند به کار برد.
در این دوره افراد شرکت کننده با متن کاوی، نحوه آماده سازی داده ها برای تحلیل داده ها و سپس با الگوریتم های خوشه بندی و طبقه بندی داده ها آشنا می شوند.
ابزار مورد استفاده در این دوره زبان برنامه نویسی پایتون و ماژول های مورد استفاده NLTK و scikit-learn می باشد.