مبانی علم داده (Data Science)

در دنیای امروز داده (Data) ارزشی به اندازه نفت (Data = Oil) یافته است. با توجه روند سیل آسا و انبوه تولید داده درباره هرچیزی، در هر زمان و مکانی، نیاز به تجزیه و تحلیل این داده ها، باعث به وجود آمدن زمینه ای جدید به نام علم داده (Data Science) شده است. مشابه نفت، کار با داده نیازمند فرآیندی است که شامل: کشف (Exploration) و استخراج (Extraction) داده، و تبدیل (Transform)، انبار کردن (Storage)، انتقال دادن (Transport)، و استفاده (Usage) کردن از آن است. ارزش تجزیه و تحلیل داده به حدی است که بسیاری، متخصصان علم داده را "مهندسان آینده" می دانند.

علم داده، حوزه بین رشته ای است که در آن متخصص علم داده، علاوه بر تسلط بر روش های تحلیلی و آماری، نیاز به دانش درباره علوم رفتاری و اجتماعی (برای فهم رفتار و اخلاق انسان ها)، مهندسی صنایع (ارزش گذاری داده ها و آشنایی با مدل ها و الگوریتم ها و ...) و خلاقیت برای یافتن راه حل ها با استفاده از فناوری اطلاعات (IT) دارد. هدف علم داده، استفاده از منابع برای پاسخگویی به 4 دسته از پرسش هاست.

- گزارش کردن (Reporting): چه چیزی اتفاق افتاده؟
- عیب یابی (Diagnosis): چرا اتفاق افتاد؟
- پیش بینی (Prediction): چه چیزی اتفاق خواهد افتاد؟
- پیشنهاد (Recommendation): بهترین چیزی که می تواند اتفاق بیفتد، چیست؟

پیشنیاز مطالعه و ورود به این مبحث تسلط بر دروس آمار مهندسی، جبر خطی، تئوری احتمالات و کاربرد آن، و ریاضی است. به نظر می رسد برای طرح این مباحث مقدماتی به 4 تا 6 واحد درسی نیاز باشد.

منابع آموزشی:

1. Data Science for Business Written by Foster Provost, Tom Fawcett From O'Reilly Media.

2. Pattern Recognition and Machine Learning Written by Christopher M. Bishop From Springer.

3. Practical Data Science with R Written by Nina Zumel, John Mount, Jim Porzak From Manning.

4. An Introduction to Statistical Learning (with Applications in R) Written by Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani From Springer.

درس اصول شبیه سازی

درس اصول شبیه سازی به ارزش 3 واحد نظری است. دروس آمار مهندسی و برنامه نویسی کامپیوتر پیشنیاز آن هستند.

این درس شامل دو بخش مفاهیم و ابزارهاست. استفاده از نرم افزار و برنامه نویسی برای شبیه سازی نقش مهمی دارد. لذا استفاده از جدیدترین ابزارها (نرم افزارها) در این زمینه ضروری است.

منابع آموزشی:

1. کتاب شبیه سازی سیستم های گسسته - پیشامد (Discrete-Event System Simulation) نوشته بنکس و کارسون (Jerry Banks, John S. Carson, Barry L. Nelson, David M. Nicol) ترجمه آقای هاشم محلوجی از انتشارات دانشگاه صنعتی شریف.

2. Simio and Simulation (Modeling, Analysis, Applications) Written by W. David Kelton, Jeffrey S. Smith, David T. Sturrock From McGraw Hill.

3. Simulation Modeling with SIMIO (A Workbook) Written by J. A. Joines, S. D. Roberts From CreateSpace Independent Publishing Platform.

4. The Big Book of Simulation Modeling (Multimethod Modeling with Anylogic 6) Written by Andrei Borshchev From AnyLogic North America.

5. Simulation with Arena Written by W. David Kelton, Randall Sadowski, Nancy Zupick From McGraw Hill.

6. Simulation Modeling and Analysis Written by Averill M. Law, W. David Kelton From McGraw Hill.

7. Simulation Written by Sheldon M. Ross From Academic Press.

8. Handbook of Simulation (Principles, Methodology, Advances, Applications, and Practice) Written by Jerry Banks From Wiley.

9. کتاب علم و هنر شبیه سازی سیستم ها (Systems Simulation: The Art and Science) نوشته رابرت شانون (Robert E. Shannon) ترجمه آقای علی اکبر عرب مازار از انتشارات دانشگاه شهیدبهشتی.

درس کنترل کیفیت آماری

درس کنترل کیفیت آماری به ارزش 3 واحد نظری بوده و درس آمار مهندسی پیشنیاز آن است. این درس پیشنیاز دروس مدیریت کیفیت و بهره وری، و آزمایشگاه اندازه گیری دقیق و کنترل کیفیت است.

منابع آموزشی:

1. کتاب کنترل کیفیت آماری نوشته آقای سیدمحمدتقی فاطمی قمی از انتشارات دانشگاه صنعتی امیرکبیر.

2. کتاب کنترل کیفیت آماری نوشته داگلاس سی. مونتگمری ترجمه آقای رسول نورالنساء از انتشارات دانشگاه علم و صنعت.

3. Statistical Quality Control Written by Douglas C. Montgomery From Wiley.

 

درس آمار مهندسی

درس آمار مهندسی به ارزش 3 واحد نظری بود و درس تئوری احتمالات و کاربرد آن پیشنیاز آن است. این درس پیشنیاز دروس کنترل کیفیت آماری، اصول شبیه سازی است.

منابع آموزشی:

1. کتاب مبانی احتمالات و آمار مهندسی (جلد دوم: آمار مهندسی) نوشته آقایان مجید ایوزیان و ابوالفضل واقفی از انتشارات ترمه.

2. کتاب آمار مهندسی (Engineering Statistics) نوشته آلبرت هوسمر باوکر و جرالد لیبرمن (Albert Hosmer Bowker, Gerald J. Lieberman) ترجمه آقای هاشم محلوجی از مرکز نشر دانشگاهی.

3. Statistics Written by David Freedman, Robert Pisani, Roger Purves From W. W. Norton & Company.

4. Elementary Statistics (A Step By Step Approach) Written by Allan G. Bluman From McGraw Hill Education.

5. OpenIntro Statistics Written by David Diez, Christopher Barr, Mine Cetinkaya-Rundel From CreateSpace Independent Publishing Platform.

6. Forgotten Statistics Written by Douglas Downing, Jeff Clark From Barron's Educational Series.