کلان-داده-یا-بیگ-دیتا- چیست؟ - دفتر استراتژی شریف

کلان-داده-یا-بیگ-دیتا- (Big Data) به نقش ها و شیوه های مورد نیاز برای جمع آوری، مدیریت، قاعده مند سازی و ارائه مجموعه ای از کلان-داده-یا-بیگ-دیتا- Big Data اشاره دارد که به شرکت ها در تصمیم گیری آگاهانه تر و مبتنی بر واقعیت کمک می کند. کلان-داده-یا-بیگ-دیتا-در کل شرکت بسیار مهم شده اند. بر تصمیمات کسبو کار تأثیر می گذارد، به ایجاد محصولات بهتر کمک می کند، توسعه محصول را بهبود می بخشد و کارایی عملیاتی را افزایش می دهد. این مقاله نقش حیاتی داده ها در سازمان، فرآیند DataOps برای مدیریت و ارائه حجم گسترده داده و نحوه اعمال DataOps را شرح می دهد.

در عصر دیجیتال، شرکت ها داده ها را با سرعت شگفت انگیزی تولید می کنند. هر کلیک وب سایت، چرخش موتور توربین، سرعت در انتقال اطلاعات و تراکنش کارت اعتباری اطلاعات جدیدی در مورد محصولات، مصرف کنندگان و محیط های عملیاتی ایجاد می کند. شتاب سریع اطلاعات منجر به شیوه های جدیدی برای ذخیره سازی، مدیریت و ارائه مجموعه های عظیم داده شده است. همانطور که شکل ۱ نشان می دهد، این شیوه هایکلان-داده-یا-بیگ-دیتا- ، محصولاتی را که براساس داده ایجاد شده اند را برای ارائه ارزش در کل شرکت ارائه می دهد.

شکل ۱. محصولات Big Data از تمام بخش های سازمان پشتیبانی می کنند

فهرست عناوین مقاله پنهان کردن

1 نقش در حال تحول کلان داده ها در سازمان

2 DataOps را در Enterprise بشناسیم

3 استفاده از DataOps

نقش در حال تحول کلان داده ها در سازمان

انباشت داده ها معمولاً در سیلوهای سازمانی آغاز می شود. یک بخش اطلاعات مربوط به کاربران و سیستم ها برای بهبود محصولات، کشف پیشرفت های عملیاتی، بهبود بازاریابی و فروش و غیره جمع آوری می کند. در حالی که این داده‌های متمایز ارزشمند هستند، جمع‌آوری مجموعه‌های کلان-داده-یا-بیگ-دیتا- در کل سازمان ارزش بیشتری را نسبت به این داده ها فراهم می‌کند.

بهره برداری از داده های بزرگ برای مزیت رقابتی

هر سازمانی از کلان-داده-یا-بیگ-دیتا- (Big Data) برای بهبود محصولات خود، بهینه سازی عملیات و درک بهتر مشتریان و بازارهای خود استفاده می کند. رسانه‌ها و سازمان‌های محصولات مصرف‌کننده از راه‌حل‌های کلان داده برای ایجاد مدل‌های پیش‌بینی برای محصولات و خدمات جدید برای پیش‌بینی تقاضای مشتری استفاده می‌کنند. تولید از راه حل های کلان-داده-یا-بیگ-دیتا-(Big DATA) برای تعمیر و نگهداری برای پیش بینی خطاها استفاده می کند. کسب‌وکارهای خرده‌فروشی از راه‌حل‌های کلان-داده-یا-بیگ-دیتا- (Big Data)داده برای بهبود تجربیات مشتری و مدیریت موثر زنجیره‌های تامین استفاده می‌کنند. سازمان های مالی از راه حل های کلان-داده-یا-بیگ-دیتا- برای جستجوی الگوهایی در داده ها استفاده می کنند که نشان دهنده تقلب بالقوه است.

حمایت از ابتکارات هوش مصنوعی

سازمان ها از هوش مصنوعی (AI) و یادگیری ماشینی (ML) به عنوان یک مزیت رقابتی برای ارائه محصولات بهتر به مشتریان خود، بهبود کارایی عملیاتی و توسعه، و ارائه بینشی که کسب و کار را بهبود می بخشد، استفاده می کنند. ابتکارات هوش مصنوعی متمرکز بر یادگیری ماشینی به مجموعه‌های بزرگی از داده‌های غنی برای آموزش و اعتبارسنجی مدل‌ها نیاز دارد.فقدان داده های کافی یک دلیل رایج برای شکست ابتکارات هوش مصنوعی است. برای دستیابی به اهداف هوش مصنوعی، یک سازمان باید رویکردی در سطح سازمانی برای جمع‌آوری، مدیریت و ارائه داده‌های جمع‌آوری‌شده در سراسر سازمان به همراه داده‌های خارجی برای پر کردن شکاف‌ها ایجاد کند.

چالش های کلان داده

جمع آوری این داده ها چالش هایی را ایجاد می کند. ویژگیهای جامعه کلان-داده-یا-بیگ-دیتا-را با “۳ Vs”: مشخص میکنند:

حجم – کسب معرفت از داده ها به طیف گسترده ای از داده های جمع آوری شده در سراسر سازمان نیاز دارد که می تواند به صدها پتابایت برسد. به عنوان مثال، گوگل هر روز ۲۰ پتابایت داده وب را پردازش می کند. راه حل های کلان داده باید حجم عظیمی از داده ها را جمع آوری، تجمیع و به مصرف کنندگان داده تحویل دهند.

سرعت – تصمیمات مبتنی بر داده نیازمند آخرین داده ها هستند. سرعت تعیین می کند که داده های جدید با چه سرعتی از منابع داده دریافت و به روز شوند. به عنوان مثال، موتور بوئینگ ۷۳۷ هر ساعت ۲۰ ترابایت اطلاعات تولید می کند. راه حل های کلان-داده-یا-بیگ-دیتا- باید تصمیم بگیرند که کدام داده و برای چه مدت ذخیره شوند.

تنوع – داده ها به اشکال مختلف در سراسر سازمان استخراج می شوند. ذخیره و تجزیه و تحلیل داده های سنتی از پایگاه های داده، صفحات گسترده و متن آسان است. داده‌های بدون ساختار شامل ویدئو، تصاویر و حسگرها چالش‌های جدیدی را ارائه می‌کنند.

اخیراً، جامعه داده تنوع، صحت، ارزش، دید و سایر موارد را اضافه کرده است تا داده های بزرگ را بیشتر مشخص کند و به چالش های ذخیره، مدیریت و ارائه آن بیافزاید.

DataOps را در Enterprise بشناسیم

برای مقابله با چالش هایکلان-داده-یا-بیگ-دیتا- سازمان ها نیاز به یک رویکرد واحد دارند. جامعه علوم داده مراحل سازمان ها را در سلسله مراتب نیازهای علم داده می شناساند. این داده ها و ذخیره سازی آن برای ایجاد برنامه ای برای استفاده گسترده تر بهینه شده است. همانطور که این داده ها به سازمان مربوط می شوند، مهندسان داده (معمولاً به عنوان بخشی از یک تابع داده متمرکز) مجموعه های گسترده تری از داده های برنامه را به یک مخزن داده تبدیل و در آن ذخیره می کنند تا از طریق محصولات داده مانند marts، cubsو view ها در دسترس قرار گیرند. تحلیلگران داده و سایرین از محصولات فقط خواندنی و مناسب برای تجزیه و تحلیل آماری و تجسم استفاده می‌کنند. دانشمندان داده از آنها برای توسعه و آموزش مدل هایی برای هوش مصنوعی و ML استفاده می کنند. افراد اغلب نقش های متعددی را ایفا می کنند. به عنوان مثال، یک تحلیلگر داده که داشبوردی را با مهارت های مهندسی داده ایجاد می کند، ممکن است برای تبدیل و جمع آوری مجدد داده ها برای یک نمای جدید یا به روز شده، به انبار داده برگردد. با این حال، قوانین حاکمیت یک سازمان ممکن است توانایی افراد را برای فعالیت در بخش‌های مختلف هرم محدود کند. در حالی که بیشتر سازمان ها یک رویکرد انبار داده متمرکز به داده ها دارند، استراتژی های توزیع شده مانند Data Mesh به ویژه برای سازمان های بزرگ در حال ظهور هستند.

شکل ۲. سلسله مراتب نیازهای علم داده

چرخه حیات DataOps

اقداماتکلان-داده-یا-بیگ-دیتا- در بالا به عنوان بخشی از مدل چرخه حیات DataOps که در شکل ۳ نشان داده شده است به طور مداوم انجام می شود. DataOps یک فعالیت مدیریت داده مشترک در میان تیم‌های Agile، متخصصان داده و ذینفعان سازمانی است که از طرز فکر، اصول و شیوه‌های Lean-Agile و DevOps برای ارائه محصولات داده با کیفیت قابل پیش‌بینی و قابل اعتماد استفاده می‌کند. بخش بالای چرخه عمر نشان می‌دهد که چگونه داده‌های خاص برنامه ها در محصولات داده‌ای که به مصرف‌کنندگان مختلف ارائه می‌شود، جریان دارد. بخش پایین نشان می‌دهد که چگونه داده‌ها مصرف می‌شوند، کنترل می‌شوند و برای بهبود راه‌حل‌هایی استفاده می‌شوند که حتی داده‌های بیشتری را در خط لوله تولید می‌کنند. بقیه این بخش هر فعالیت DataOps را شرح می دهد.

شکل ۳. چرخه حیات DataOps

جمع آوری داده ها – معماران سیستم و راه حل، تیم های چابک ومدیران سیستم دور سنج می سازند، وارد سیستم می شوند و در مورد سیستم و رفتارهای کاربر برای جمع آوری داده ها اقدام به نظارت می کنند. معماران سیستم اطمینان می‌دهند که راه‌حل‌ها به راحتی کاربردی هستند و درست طراحی شده اند ، بنابراین می‌توان به داده‌های برنامه به صورت خارجی، اغلب از طریق APIها، دسترسی داشت. همانطور که داده‌ها برای شرکت‌های بزرگ‌تر حیاتی‌تر می‌شوند، کار برای جمع‌آوری داده‌های بهتر و افشای آن‌ها از طریق APIها ممکن است در اولویت قرار گیرد و به تخصیص ظرفیت نیاز داشته باشد (به ART Backlog مراجعه کنید) تا از تعادل مناسب با سایر backlogs اطمینان حاصل شود.

جمع آوری و تبدیل – مهندسان داده، داده‌ها را از سراسر سازمان به شکل‌های قاعده مند، تبدیل و جمع آوری می‌کنند که برای استفاده کارآمد توسط مصرف‌کنندگان داده بهینه‌سازی شده‌اند. یک معماری داده متمرکز، ذخیره سازی کارآمد و تحویل محصولات داده های ثابت را در سراسر سازمان تضمین می کند. مهندسان داده باید «درVS»هایی را که قبلاً بحث شد متعادل کنند و تعیین کنند که کدام داده ذخیره شود، چه مدت، زمان دسترسی قابل تحمل و غیره. آنها داده ها را به عنوان یک محصول می بینند و تفکر طراحی و کیفیت داخلی را اعمال می کنند. Personas و Journey Maps به آن‌ها کمک می‌کند تا با دردها، دستاوردها و تجربیات کاربران داده‌ها همدلی کنند و نحوه ارائه محصولات داده بهتر را تعیین کنند.

Monitor – مهندسان داده، محصولات داده را از انبار داده به اشکال مختلف، از جمله داده‌ها، کیوب ها و از منظرنحوه استفاده مصرف‌کنندگان داده ، مستقر می‌کنند. مانند دیگر راه‌حل‌های فناوری ، راه‌حل‌های داده از فناوری Cloud بهره می‌برند و تحویل مداوم را از طریق خط لوله DevOps که برای داده‌ها طراحی شده است، اعمال می‌کنند. این شیوه‌ها به سرعت تغییرات داده‌ها را از طریق توسعه، Q/A، UAT و محیط‌های تولید برای بازخورد مصرف‌کننده منتقل می‌کنند. محیط‌های متعدد تضمین می‌کنند که داشبوردها، گزارش‌ها، مدل‌ها و سایر مصنوعات وابسته به محتوای داده‌ها و قالب‌ها می‌توانند با داده‌ها تکامل یابند. در DevOps، نظارت در تمام مراحل خط لوله داده برای شناسایی ناهنجاری‌ها در داده‌ها (شمارش ردیف، داده‌های خارج از محدوده) و عملیات داده (وقفه‌های زمانی غیرمنتظره) انجام می‌شود و هشدارهایی را به تیم داده ارسال می‌کند.

مصرف – مصرف کنندگانکلان-داده-یا-بیگ-دیتا- را می توان به دو گروه طبقه بندی کرد، همانطور که در شکل ۴ نشان داده شده است. تحلیلگران از محصولات داده برای کشف بینش و تجسم مشتریان داده خاص استفاده می کنند. دانشمندان داده و توسعه دهندگان ML از آنها برای توسعه و آموزش مدل ها استفاده می کنند. مشتریان آنها (مشتریان داده در شکل ۴) ذینفعانی در سطح شرکت هستند که به دنبال بینش تجاری برای تصمیم گیری، بهبود عملیات و بهبود راه حل ها هستند. خطوط مختلف کسب و کار، مدیران محصول، توسعه دهندگان هوش مصنوعی و سایرین نیازهای داده منحصر به فردی دارند. برای فعال کردن این افراد از طریق یک مدل خود خدمت، شرکت‌ها باید روی ابزارها، بسته‌های تحلیلی و منابعی سرمایه‌گذاری کنند تا از دسترسی موقت برای دستکاری محلی پشتیبانی کنند. این سرمایه گذاری بار اعضای تیم داده متمرکز را برای گزارش دهی و سایر کارهای روزمره کاهش می دهد.

شکل ۴. کلان-داده-یا-بیگ-دیتا- مشتریان زیادی در کل شرکت دارد.

DataOps باید حریم خصوصی داده ها، محرمانه بودن، اقامت، اشتراک گذاری، حفظ و سایر الزامات قانونی را اعمال کند. راه حل کلان-داده-یا-بیگ-دیتا- باید از طریق کنترل های دسترسی، ممیزی و نظارتی که نفوذ و نقض داده ها را شناسایی می کند، امنیت را تضمین کند. مانند سایر محصولات دیجیتال، باید تحمل خطا و بازیابی فاجعه را از طریق فروشندگان یا راه حل های خانگی ارائه دهد.

راه حل ها را افزایش دهید – رهبران نمونه کارها و قطار انتشار چابک (ART) از داده ها برای بهبود راه حل هایی استفاده می کنند که ارزش مشتری (محصولات بهتر) و ارزش تجاری (داده های بهتر) را ارائه می دهند. تجزیه و تحلیل داده ها می تواند فرصت هایی را برای ارائه راه حل های جدید نشان دهد و اولویت بندی ویژگی ها را برای راه حل های موجود اطلاع دهد. شکاف های داده همچنین فرصت هایی را برای بهبود راه حل ها برای جمع آوری داده های اضافی نشان می دهد.

استفاده از DataOps

بخش های قبلی اهمیت یک استراتژی داده واضح و قانع کننده را شرح می دهد. این بخش راهنمایی‌های بیشتری را که سازمان‌ها می‌توانند برای حمایت از سفر داده‌های بزرگ خود اتخاذ کنند، توضیح می‌دهد.

DataOps یک مساله مهم برای پورتفولیو است

پرداختن به مسائل مرتبط با کلان داده در سطح پورتفولیو به بررسی چشم انداز، سرمایه گذاری و حاکمیت سازمانی در بالاترین سطوح سازمان کمک می کند(شکل ۵). در حالی که ART ها داده ها را ایجاد می کنند، ارزش از تجمیع داده ها در سطوح پورتفولیو و شرکت می آید. راه‌حل‌های کلان-داده-یا-بیگ-دیتا- مستلزم سرمایه‌گذاری استراتژیک از سوی سازمان و رویکردی جامع است که هر یک از جریان‌های ارزش توسعه سازمان را با شیوه‌های رایج DataOps که مجموعه داده‌های منسجمی را تولید می‌کند و در کل سازمان استفاده می‌شود، همسو می‌کند. رهبران پورتفولیو از بودجه ناب برای سرمایه گذاری در زیرساخت داده های بزرگ و شیوه های DataOps برای انجام این کار استفاده می کنند. آنها همچنین از Portfolio Epics و Portfolio Backlog برای تعیین و اولویت بندی زیرساخت ها، فناوری ها و داده های مورد نیاز برای پشتیبانی از سازمان استفاده می کنند (شکل ۵).

شکل ۵. کلان داده مشتریان زیادی در کل شرکت دارد

در ابتدا بر عملکرد داده متمرکز شوید

سازماندهی حول ارزش، تلاش می کند تا جریان را با حصول اطمینان از اینکه تیم ها و ART ها تمام مهارت های لازم برای ارائه ارزش را دارند، بهینه کند. متأسفانه، بیشتر سازمان‌ها هنوز در حال رشد عملکردهای مهندسی داده و علوم خود هستند و در نتیجه تقاضای بیشتری نسبت به ظرفیت برای این مهارت‌ها دارند.تمرکز اولیه اغلب برای پذیرش فناوری اولیه برای به حداکثر رساندن مهارت های موجود و ایجاد زیرساخت ها و شیوه های DataOps مفید است. تمرکز نیز مدیریت حریم خصوصی و امنیت را ساده می‌کند که حفاظت از آنها با رویکرد سلب‌شده عملاً غیرممکن است. این تابع متمرکز می‌تواند بیشتر نیازهای داده‌ای سازمان را از طریق رویکردهای مشتری محوری که قبلاً توضیح داده شد، برآورده کند. همانطور که در شکل ۶ نشان داده شده است، در مواردی که پشتیبانی اضافی مورد نیاز است، الگوی شناخته شده ای از ارائه خدمات اضافی به سایر بخش های سازمان از طریق یک سرویس مشترک وجود دارد. با گذشت زمان، سازمان ها عملکردهای داده خود را برای حمایت از شرکت های گسترده تر و جاسازی افراد در ARTs و جریان های ارزش عملیاتی توسعه خواهند داد. با این حال، یک جریان ارزش توسعه کلان-داده-یا-بیگ-دیتا- از مهندسان داده که داده های سازمانی انبوه را ارائه می دهند احتمالاً برای مدتی وجود خواهد داشت.

شکل۶.با متمرکز ساز عملکرد داده شروع کنید که از سایر بخش های سازمان به عنوان یک سرویس مشترک پشتیبانی می کند.

رشد استعدادهای فنی

مهندسی داده، تحلیل و مهارت‌های توسعه‌دهنده AI/ML در حجم بالای تقاضا و به کارگیری داده‌های تخصصی و مهارتی یک چالش مهم است. سازمان ها برای جذب و حفظ این استعدادها باید داده ها و چشم انداز هوش مصنوعی قانع کننده و الهام بخش ایجاد کنند. متخصصان داده می‌خواهند از دیگر متخصصان داده یاد بگیرند و رشد کنند تا با فناوری‌ها و شیوه‌های به‌سرعت در حال تحول همگام شوند.

استفاده از DataOps برای ساخت راه حل های بهتر

راه‌حل‌ها باکلان-داده-یا-بیگ-دیتا- اطلاع‌رسانی و تقویت می‌شوند، و تیم ای آر تی به مهارت‌های علم داده و مهندسی داده نیاز دارند. همانطور که قبلا توضیح داده شد، کارکردهای داده می تواند منابعی را به عنوان یک سرویس اشتراکی در اختیار ART ها قرار دهند. اما آنها باید کار ART را با مسئولیت اصلی خود برای ایجاد و تکامل شیوه‌های DataOps که شامل ارائه محصولات داده به شرکت است، متعادل کنند. هنگام حمایت از ART ها، آنها باید مانند یک تیم توانمند (به تیم های چابک مراجعه کنید) عمل کنند تا شایستگی داده های فنی را در سراسر سازمان رشد دهند. در این مقام، آنها برای انجام کار نیستند، بلکه برای آموزش نحوه انجام آن به دیگران هستند.

جهت ارتقاء سطح کیفی مقالات و تکمیل مباحث مربوطه، لطفا نظرات و دیدگاههای خود را در پایان این مقاله درج کنید، همچنین چند مقاله مرتبط با موضوع چشم انداز پورتفولیو برای مخاطبان سایت شریف استراتژی به اشتراک گذاشته شده است.

>> مقالات مرتبط را بخوانید