امروزی نیاز داریم. هنگامی که از تکامل یک سامانه صحبت می‌کنیم، منظورمان تغییرات هدایت‌شده‌ای است که بر اساس قواعد و سیاست‌ها، به شکل محلی انجام می‌شود بدون آن که یکپارچگی آن سامانه را از بین ببرد. اما، یکپارچگی در سامانه‌های بزرگ مقیاس توسط گروه‌های مختلفی از ذینفعان انجام می‌شود. هیچ تضمینی وجود ندارد که این تغییرات کاملاً قاعده‌مند بوده و بر اساس قواعد از پیش تعریف شده انجام پذیرد.
عناصر ناهمگن، ناسازگار و در حال تغییر
اندازه سامانه‌های بزرگ مقیاس به این معنی است که عناصر آن (همچون سخت‌افزار، نرم‌افزار، روال‌ها، قواعد، افراد و …) ناهمگن، ناسازگار و در حال تغییر هستند. عناصر نرم‌افزاری به دلیل گوناگون بودن منابع آن‌ها ناهمگن هستند (زبان‌های برنامه‌سازی متفاوت، سکوهای مختلف، متدلوژی‌های متفاوت و …). از آن جا که ایجاد نرم‌افزارها نیز در شرایط متفاوتی (از منظر مکان‌ها، زمان‌بندی‌ها، فرآیندها، اهداف، ذینفعان و …) انجام شده است، احتمالاً در طراحی، ساخت و بهره‌برداری با یکدیگر ناسازگارند. بخش‌های مختلف یک سامانه همواره در حال تغییر هستند. محیط عملیاتی تغییر می‌کند؛ بخش‌های خراب سخت‌افزار باید جایگزین شوند؛ نرم‌افزارها و سخت‌افزارها به روز می‌شوند؛ و پیکربندی مؤلفه‌ها اصلاح می‌شوند.
از بین رفتن تدریجی مرز بین افراد و سامانه
افراد نه تنها کاربران یک سامانه بزرگ مقیاس هستند، بلکه بخشی از رفتار کلی آن نیز محسوب می‌شوند. در واقع، مرز بین سامانه و نقش‌های کاربر/ توسعه‌دهنده به روشنی مشخص نیست. یک شهر را در نظر بگیرید. افرادی که در این شهر ساکن هستند، ممکن است تغییر و نگهداری آن را نیز به عهده داشته باشند. در واقع یک شخص، نقش‌های متفاوتی دارد. در یک سامانه بزرگ مقیاس نیز چنین وضعیتی رخ می‌دهد. یک شخص در یک زمان ممکن است کاربر سامانه باشد؛ در وقتی دیگر ممکن است یک نقش نگهداشت را بر عهده گیرد؛ در زمانی دیگر می‌تواند عملکردهای سامانه را اضافه و کم یا تصحیح کند. در نظر گرفتن افراد به عنوان بخشی از سامانه‌های بزرگ مقیاس به این معنی است که با تغییر توانایی‌های محاسباتی و پیکربندی سازمان‌ها باید فرآیندها و روال‌های مربوطه جهت کمک به درک افراد در راستای اهداف و مأموریت‌های آن‌ها اصلاح شود، زیرا افراد بخشی از خود سامانه بزرگ مقیاس هستند.
خرابی‌های طبیعی
از آن جا که زیربنای فیزیکی یک سامانه بزرگ مقیاس بسیار گسترده است، خرابی سخت‌افزار دیگر یک امر غیرعادی نیست؛ بلکه به طور طبیعی اتفاق می‌افتد. همچنین، از آنجا که مؤلفه‌های نرم‌افزاری فراتر از ظرفیتی که طراحی شده‌اند، تحت فشار قرار می‌گیرند، رفتار آن‌ها نیز ممکن است نامطلوب باشد؛ که این مسئله نیز کاملاً عادی است. فرض کنید یک پروتکل ارتباطی در هر یک میلیون انتقال فایل یک بار با شکست روبه‌رو می‌شود. اگر انتقال فایل یک میلیون بار در روز اتفاق افتد، به طور متوسط یک شکست در روز خواهیم داشت. در سامانه‌های بزرگ مقیاس معمولاً بروز خرابی آن قدر متداول است که در واقع می‌توان گفت خطا «همیشه» رخ می‌دهد. با توجه به مقیاس چنین سامانه‌هایی، مسئله خرابی باید به شکل یک مشکل پیوسته در طراحی و ساخت لحاظ شود. 
پارادایم‌های جدید برای استفاده و سیاست‌گذاری
به دلیل اندازه سامانه‌های بزرگ مقیاس، افرادی که مسئول ساخت آن‌ها هستند (احتمالاً مدیران، توسعه‌دهندگان، فروشندگان، و …) نمی‌توانند به طور قطعی تعریف شوند. نمی‌توان نیازمندی‌های متغیر و غیرقطعی ذینفعان را کنترل کرد. نمی‌توان نیازمندی‌ها را به شکل متمرکز و سراسری نظارت کرد. در حقیقت اندازه سامانه‌های بزرگ مقیاس باعث بروز یک چالش اساسی برای مدیران می‌شود. اگر نتوان نیازمندی‌های واقعی ذینفعان را به طور کامل مشخص کرد، چگونه می‌توان فرآیند بستن قرارداد، طراحی و ساخت را کنترل کرد.
۱-۶ چالش‌های سازمان‌های بزرگ مقیاس
سازمان‌های بزرگ مقیاس دارای ویژگی‌هایی هستند که باعث می‌شوند رویکردهای (فعلی و مورد استفاده) روش‌های مهندسی نرم‌افزار نتوانند پاسخگوی نیازهای آن‌ها باشند. این ویژگی‌ها عمدتاً ناشی از «مقیاس» این گونه از سازمان‌ها است. روش‌های امروزی برای استخراج صحیح نیازمندی‌ها در این سازمان‌ها کافی نیستند. موفقیت سازمان‌های بزرگ مقیاس و دست‌یابی به اهداف و مقاصد این نوع از سازمان‌ها بستگی به توسعه توانمندی‌های جدید دارد [۳]. از نمونه این چالش‌ها می‌توان به بحث استخراج و اولویت بندی نیازمندی‌ها در سامانه مدیریت شهری ۱۳۷ شهرداری تهران اشاره نمود که شامل میلیون‌ها رکورد ثبت شده از خواسته‌ها و نیازهای شهروندان می‌باشد که استفاده از این حجم عظیم اطلاعات، این سامانه را گاهاً دچار مشکل می‌کند.
۱-۷ انگیزه
امروزه اهمیت اولین فاز از فازهای مهندسی نیازمندی‌ها بر همگان مشخص گردیده و بارها مشاهده کردیم که نادیده گرفتن یک ذینفع منجر به صدمات جبران ناپذیر و یا حداقل منجر به نادیده شدن گروهی از ذینفعان دیگر گردیده است. در استخراج نیازها، افراد دیدگاه‌ها و نظرات متفاوتی در نیازها و اولویت اجرای آنها دارند و با رشد روز افزون بازار فناوری اطلاعات و بزرگ شدن پروژه‌ها اهمیت و پیچیدگی این موضوع بیشتر می‌گردد.
انگیزه از جایی شروع می‌شود که تا ندانیم چه مسائلی نیاز به حل شدن دارند نمی‌توانیم به
دنبال ارائه راه حل‌های آنها باشیم. بنابراین شناسایی و اولویت بندی نیازها موضوعی است که باید در ابتدا مورد توجه قرار گیرد. با توجه به اهمیت استخراج نیازمندی‌ها و مدیریت ارتباط با شهروند، پژوهش قابل توجهی در این زمینه انجام نشده است. اکثر مقالات منتشر شده در این زمینه نیز جنبه نظری و تئوری داشته و تعداد کمی از آنها به صورت کاربردی مفهوم مدیریت ارتباط با شهروند را مورد بررسی قرار داده‌اند [۲].
۱-۸ تعریف مسئله
با رشد و توسعه‌ی بازار فناوری اطلاعات این موضوع به وضوح مشخص است که مشتریان و توسعه دهندگان از نظر جغرافیایی در سراسر کشور و جهان پراکنده می‌باشند و در نتیجه روش‌های چون ملاقات‌های شخصی در بحث استخراج نیازمندی‌ها تقریباً غیر ممکن است. علاوه بر این، رشد اندازه و پیچیدگی سیستم‌های نرم‌افزاری و همچنین رشد رو به افزایش تعداد ذینفعان، مسئله‌ی مدیریت و هماهنگی استخراج نیازها را در سازمان‌ها و سامانه‌های بزرگ مقیاس روشن می‌سازد [۴-۶]. در این میان تکنیک‌های سنتی مهندسی نیازمندی‌ها روش‌هایی اقتباس گردیده از مدل‌های متمرکزی هستند که استفاده از این تکنیک‌ها در سامانه‌های بزرگ مقیاس چالش برانگیز و زمانبر و گاهی ناممکن است.
در نتیجه لازم است تکنیک‌ها و یا ابزارهای جدیدی در راستای پشتیبانی از سازمان‌ها و یا سامانه‌های بزرگ مقیاس در استخراج نیازمندی‌ها توسعه داده شوند که در این خصوص رهیافت‌های جدید باید دارای قابلیت مقیاس پذیری بالایی باشند. در این راستا قصد داریم روش‌های پرکاربرد موجود در استخراج نیازمندی‌ها را اعم از روش‌های سنتی، استفاده از ابزارها و روش‌های نوین مورد بررسی و تجزیه و تحلیل قرار داده و مزایا و معایب هر روش را تشریح کنیم. سپس به تکنیک‌های مورد استفاده در افزایش سطح رضایتمندی ذینفعان پرداخته تا بتوانیم در راستای اهداف تحقیق از آنها بهره‌مند گردیم. در آخر با استفاده از تدبیری به ارائه چارچوبی جهت استخراج و اولویت بندی صحیح نیازمندی‌ها در سازمان‌های بزرگ مقیاس بپردازیم.
۱-۹ فرضیه
نکته قابل توجه در بحث تعیین اندازه سازمان یا سامانه این است که معیارهای متفاوت و استانداردی در این مورد ذکر گردیده است. از جمله‌ی این معیارها می‌توان به تعداد خطوط برنامه، زمان، هزینه و غیره اشاره نمود. اما قابل ذکر است در این تحقیق منظور ما از سازمان‌ها و یا سامانه‌های بزرگ مقیاس، آنهایی هستند که تعداد زیادی از ذینفعان را در بر می‌گیرند. ذینفعان افرادی هستند که به هر نحو سطوحی از تأثیرات روی نیازمندی‌های آن سازمان و یا سامانه دارند. از نمونه‌ی این سازمان‌ها می‌توان به مرکز مدیریت شهری ۱۳۷ شهرداری تهران اشاره نمود که دارای پایگاه داده‌ای شامل میلیون‌ها رکورد از نیازهای ثبت شده مردمی می‌باشد.
۱-۱۰ اهداف تحقیق
اصلی‌ترین اهدافی که این تحقیق پوشش می‌دهد، عبارتند از:
بررسی مراحل لازم در استخراج نیازمندی‌ها
درک چگونگی برنامه ریزی و تعیین استراتژی استخراج نیازمندی‌ها
بررسی تکنیک‌های مطرح در استخراج نیازمندی‌ها به همراه نقاط ضعف و قوت آنها
ارائه چارچوبی در استخراج و اولویت بندی نیازمندی‌ها در سازمان‌ها و یا سامانه‌های بزرگ مقیاس
ارزیابی چارچوب ارائه شده و بحث و نتیجه گیری
به طور کلی این پایان نامه از پنج فصل تشکیل شده است. در فصل اول مقدمه‌ای بر مهندسی نیازمندی‌ها و اولین و مهم‌ترین فاز آن یعنی استخراج نیازمندی‌ها ارائه خواهد شد. در فصل دوم به ادبیات موضوع و پیشینه تحقیق پرداخته خواهد شد. این تحقیقات شامل پر کاربردترین و رایج‌ترین روش‌های استخراج نیازمندی‌ها در سه گروه ۱. روش‌های سنتی، ۲. استفاده از ابزارها و ۳. روش‌های نوین استخراج نیازمندی‌ها می‌باشد. در این فصل نیز تلاش‌هایی که در جهت افزایش سطح رضایتمندی ذینفعان صورت گرفته مطرح و همچنین در ارتباط با نقاط ضعف و قوت تمامی این روش‌ها بحث خواهد گردید. در فصل سوم به ارائه چارچوب پیشنهادی در ارتباط با استخراج و اولویت بندی نیازمندی‌ها در سازمان‌های بزرگ مقیاس به زبان فارسی مبتنی بر نیازمندی‌های عملیاتی و غیر عملیاتی پرداخته و در فصل چهارم در ارتباط با محاسبات و یافته‌های تحقیق به روش مطالعه میدانی و کتابخانه‌ای بحث خواهد گردید. در فصل آخر یعنی فصل پنجم به نتیجه گیری و پیشنهادات آتی پرداخته خواهد شد. پس از آن در پیوست، منابع و مآخذ و ضمایم همچنین چکیده انگلیسی قابل دسترس است.

فصل دوم
ادبیات و پیشینه تحقیق
۲-۱ مقدمه
امروزه میزان داده‌های در دسترس هر پنج سال دو برابر می‌شود و سازمانی تواناست که قادر باشد کمتر از ۷% از اطلاعاتش را مدیریت نماید. بر اساس تحقیقات شرکت IBM سازمان‌ها کمتر از ۱% از داده‌هایشان را برای تحلیل استفاده می‌نمایند. سازمان‌ها داده‌های تجاری زیادی را در تصرف خود دارند، در حالی که هنوز با فقدان دانش تجاری مواجه هستند. تقسیم بندی مشتریان، افزایش رضایت آنها و یا حتی بدست آوردن سهم بیشتری از بازار نسبت به رقبا با استفاده از ابزارهای داده کاوی از کاربردهای آن می‌باشد [۷]. با استفاده از داده کاوی می‌توان به دانشی دست یافت که خود انسان قرن‌ها بعد این دانش را کسب خواهد کرد. در حقیقت داده کاوی در زمینه‌های متعددی از قبیل پزشکی، بورس اوراق بهادار، هواشناسی، بازار
یابی، تشخیص کلاه‌برداری‌های بانکی و بیمه‌ای، تجارت الکترونیک و … وجود دارد. خروجی همه‌ی این زمینه‌ها بر این اصل صحه می‌گذارد که انسان به دلایل مختلف اعم از سرعت پردازشی، جهل داده‌ای، چگونگی پردازش و … نمی‌تواند نظم‌های پیچیده موجود در نهان داده‌های حجیم را شناسایی نماید [۸]. در محیط امروزی، سازمان‌های بسیاری در تلاش هستند که فلج اطلاعات را شکست بدهند. در این راستا داده کاوی سازمانی۶ به عنوان یک ابزاری می‌باشد که مدیران را قادر می‌سازد تا سریع‌تر نسبت به آینده عمل نمایند، فعال باشند نسبت به اینکه واکنش پذیر باشند، بدانند تا اینکه حدس بزنند. پر واضح است که با داشتن این قابلیت، سازمان‌ها قادرند دانش ارزشمندی را از داده‌هایشان بدست آورند [۹]. در واقع علم داده کاوی انسان را قادر می‌سازد که حجم عظیمی از داده‌ها را مورد پردازش عمیق قرار دهد و کلیه نظم‌هایی را که در عمق داده وجود دارند، همچون طلا در یک معدن طلا، به صورت دانشی با ارزش کشف کرده و جهت استفاده عرضه نماید [۸]. در این فصل با مقدمات علم داده کاوی آشنا خواهیم شد و پس از آن به بررسی روش‌ها و تکنیک‌های استخراج نیازمندی‌ها پرداخته و در آخر سعی داریم پس از بررسی نقاط قوت و ضعف این روش‌ها بخصوص در زبان فارسی به تبیین راهکار پیشنهادی خود بپردازیم.
۲-۲ انگیزه‌های کاوش داده
با توجه به مطالب مطرح شده، شاید بتوان اولین انگیزه کاوش داده را رشد روز افزون آن دانست. در واقع رشد داده به حدی است که تنها در صورت وجود ابزار مکانیزه برای بررسی آن می‌توان امیدوار به استفاده از آن بود. زیرا در غیر اینصورت همزمان با تحلیل حجم کوچکی داده، حجم بسیار زیادی از همان داده در حال تولید شدن است که هرگز فرصتی برای کاوش آن وجود نخواهد داشت. به علاوه مشکلاتی دیگر که در ادامه اشاره شده‌اند وجود خواهند داشت:
معمولاً دانشی که در داده‌ها وجود دارد خیلی بدیهی، روشن و واضح نیست.
تحلیل‌گران انسانی ممکن است هفته‌ها برای کشف اطلاعات با ارزش از داده وقت صرف کنند و گاهی اوقات ممکن است با صرف زمان زیادی لزوماً موفق هم نشوند.
گاهی اوقات با وجود امکان جمع آوری داده، این کار انجام نمی‌شود. دلیل عدم جمع آوری داده معمولاً عدم وجود دانش برای جمع آوری آن است. اینکه داده سرمایه یک سازمان است خود دانشی مهم و با ارزش است که همیشه وجود ندارد [۸]!
۲-۲-۱ انگیزه‌های تجاری
هنگامیکه می‌خواهیم داده‌ها را از بعد تجاری مورد پردازش قرار دهیم نیاز به داده‌هایی داریم که ماهیت تجاری داشته باشند. به طور کلی سه منبع برای جمع آوری داده‌های تجاری وجود دارند که عبارتند از: داده‌های وب و داده‌های تجارت الکترونیک، خرید و فروش‌های موجود در فروشگاه‌های خواربار فروشی/سوپر مارکت‌های زنجیره‌ای

Post your comment

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *