عام

# الاتجاهات | البيانات الكبيرة

"الشخص الذي يملك المعلومات ، يمتلك العالم." يبدو أن هذه العبارة لم تبدو صحيحة كما هي اليوم. في العقد الثاني من القرن الحادي والعشرين ، أصبحت المعلومات ليس فقط المواد الخام والأدوات والأسلحة ، ولكن أيضًا أهم مصدر للقتال بين الشركات والحكومات. سنتحدث عن هذا اليوم.

</ p>

في بيئة الأعمال اليوم ، وإدارة البياناتهو مؤشر حاسم لنجاح المؤسسة. بدأت العديد من الشركات في إدراك أهمية مهارات المعلومات. اليوم ، ما يسمى "البيانات الكبيرة" هو الاتجاه الأكثر أهمية الذي يمتد إلى مجموعة متنوعة من مجالات الأعمال والتكنولوجيا.

يستخدم مصطلح "البيانات الكبيرة".للإشارة إلى المبادرات والتكنولوجيات التي تشمل أصول متنوعة وسريعة النمو لهذه الفئات المختلفة. مجموعة متنوعة من هذه المعلومات تعقيد معالجتها ، وأولئك الذين تمكنوا من القيام بذلك لصالح أعمالهم ناجحة اليوم.

تتضمن البيانات الكبيرة إنشاء وحدات تخزين كبيرةالبيانات المعقدة وتخزينها واستخراجها وتحليلها. يعتمد نظام البيانات الضخمة على مبدأ ثلاثة vs - حجم (حجم) ، سرعة (سرعة) ومجموعة متنوعة (متنوعة).

حجم. قبل عشرين عامًا ، واجه الكمبيوتر العادي صعوبة كبيرةالقيادة بسعة 10 غيغابايت في المتوسط. اليوم ، تعالج المنصات الاجتماعية مثل Facebook أكثر من نصف مليار تيرابايت من البيانات يوميًا. تولد طائرة بوينج مئات تيرابايت من بيانات الرحلة لرحلة واحدة. يضمن الاستخدام الواسع للهواتف الذكية والأجهزة اللوحية إنتاج مليارات تيرابايت من المعلومات التي يتم تحديثها باستمرار ، وهي متنوعة ومتنوعة مثل عالمنا.

السرعة. أنظمة تتبع النقر على الإنترنت كل ثانيةتحليل ملايين مستخدمي الويب. يتم تحديث التغييرات في حالة التداول في بورصات الأوراق المالية داخل ثوانٍ دقيقة. يمكن أن تدعم خوادم الألعاب الاتصال لمرة واحدة لملايين المستخدمين الذين يقومون بالعديد من الإجراءات كل ثانية. هذه مجرد أمثلة قليلة توضح كيف يتم إنشاء بيانات جديدة محمومة.

التنوع. لا ينطبق مفهوم "البيانات الضخمة"الحروف والأرقام فقط: تشمل الصوت والفيديو والنص المبعثر والبيانات من الشبكات الاجتماعية وأكثر من ذلك بكثير. وحيث يرى البعض تفريغًا عملاقًا للمعلومات غير الضرورية ، يرى آخرون رصيدا لا يقدر بثمن يمكن أن يغير العالم.

تم تقديم مصطلح البيانات الضخمة لأول مرة في الفصل.أورايلي لروجر موغالوس في عام 2005. ومع ذلك ، فإن مسألة كيفية معالجة البيانات المتاحة بدأت تطرح منذ وقت طويل للغاية. في الواقع ، فإن السجلات الأولى لمحاولات استخدام البيانات لإدارة أنشطة المؤسسات تجاوز عمرها 7000 عام.

كان في تلك الأيام أن بلاد ما بين النهرين بدأت في القيادةالمحاسبة للحصاد وتربية الماشية. استمرت مبادئ المحاسبة في التطور والتحسن ، وفي عام 1663 ، بدأ الديموغرافي جون جراونت في تسجيل وتحليل معدلات الوفيات في لندن. لقد فعل ذلك حتى يقدر الجمهور مدى انتشار الطاعون الدبلي في تلك الأيام.

في كتابه الطبيعي والسياسيقدمت غرانت للعالم أول تحليل إحصائي للبيانات على الإطلاق. يلقي الكتاب الضوء على الأسباب الرئيسية للوفاة في إنجلترا في القرن السابع عشر. بفضل هذا العمل ، أصبح Graunt مشهورًا كرائد في مجال الإحصاءات

منذ ذلك الحين ، استمرت مبادئ المحاسبةلتحسين ، ولكن لا شيء غير عادي في هذا الاتجاه نشأت حتى نهاية القرن 19 أعلن الدخول في عصر المعلومات. بدأت حقبة جديدة في عام 1889 عندما اخترع هيرمان هولريث نظام كمبيوتر لفرز بيانات التعداد.

حدثت القفزة البارزة التالية في عام 1937 ،عندما كان رئيس الولايات المتحدة فرانكلين روزفلت. بعد إقرار قانون أمن الدولة في الكونغرس ، طُلب من الحكومة الاحتفاظ بسجلات لملايين الأمريكيين. نتيجة لذلك ، طلبت الحكومة من IBM تطوير نظام قارئ بطاقات مثقوب ، والذي تم تصميمه لتخزين كميات هائلة من البيانات.

ومع ذلك ، فإن أول آلة معالجة البياناتنظام Colossus ، الذي طوره البريطانيون عام 1943 لفك رموز النازية خلال الحرب العالمية الثانية ، يعتبر كذلك. بحث الجهاز عن أي أنماط تظهر بانتظام في الرسائل المعترضة. كان النظام يعمل بسرعة قياسية وكان قادرًا على معالجة 5000 حرف في الثانية ، مما سمح لبضع ساعات للقيام بالعمل الذي استغرق أسابيعًا في السابق.

تم إنشاء أول مركز بيانات من قبل الأمريكيالحكومة في عام 1965 وكان المقصود لتخزين الملايين من بصمات الأصابع والسجلات الضريبية. تم تسجيل السجلات على أشرطة مغناطيسية تم تنظيمها وتخزينها في غرفة خاصة. ويعتقد أن هذا كان أول مستودع إلكتروني للمعلومات.

في عام 1989 ، متخصص بريطاني في علوم الكمبيوتراخترع تيم بيرنرز لي شبكة الكمبيوتر في جميع أنحاء العالم بهدف ضمان تبادل المعلومات من خلال نظام النص التشعبي. ثم لم يستطع حتى أن يتخيل التأثير الذي سيحدثه العالم على اختراعه ، والذي أصبح فيما بعد يعرف باسم الإنترنت. بعد بداية التسعينات ، بدأ عدد متزايد من الأجهزة بالاتصال بالشبكة العالمية ، مما يعني أن معدل توليد البيانات بدأ ينمو بشكل أكثر نشاطًا.

في عام 1995 ، تم إنشاء أول حاسوب عملاق. كان هذا الجهاز قادرًا على القيام بالعمل خلال ثوانٍ ، الأمر الذي كان سيستغرق شخصًا بسيطًا منذ آلاف السنين. ثم جاء القرن الحادي والعشرين.

هنا ننتقل مرة أخرى إلى عام 2005 ، متىصاغ روجر موغالوس مصطلح "البيانات الضخمة". في نفس العام ، أنشأت Yahoo منصة Hadoop المفتوحة الآن ، والتي كان هدفها فهرسة الإنترنت بالكامل. اليوم ، يتم استخدام Hadoop من قبل ملايين الشركات لتلقي ومعالجة كميات هائلة من البيانات.

خلال السنوات العشر الماضية ، كانت الشبكات الاجتماعية سريعةالمتقدمة ، ونمت كمية المعلومات التي أنشأها المستخدمون يوميا. واحدة تلو الأخرى ، بدأت الشركات والحكومات في تنفيذ مشاريع البيانات الكبيرة. على سبيل المثال ، في عام 2009 ، أنشأت حكومة الهند أكبر قاعدة بيانات للبيانات البيومترية ، والتي تخزن بصمات ومسح قزحية العين لجميع المواطنين في البلاد.

في عام 2010 ، تحدث الرئيس التنفيذي لشركة Google إريك شميدتمؤتمر التكنولوجيا في كاليفورنيا ، قائلا أنه على مدى السنوات السبع الماضية ، اكتسبت الشركة 5 إكسبايت من البيانات. كان من غير المحتمل أن يتخيل أنه بحلول عام 2017 سيتم إنشاء كمية مماثلة من المعلومات يوميًا. في الوقت نفسه ، معدلات النمو لا أعتقد أن يتباطأ.

سمحت لنا نظرة إلى الماضي بإجراء تقريبيفكرة عن الاتجاهات التي تنتظرنا في المستقبل. إذا كانت المؤسسات التي تمتلك المعلومات قبل عقدين من الزمان هي الأكثر نجاحًا ، فإن أولئك القادرين على تفسير المعلومات المتاحة واستخدامها على أفضل وجه يكونون ناجحين. من المنطقي توقع أن يعتمد النجاح في المستقبل على القدرة على فرض البيانات الضخمة للمساعدة في اتخاذ القرارات الاستراتيجية الصحيحة.

بالتأكيد معظمنا في ذكرمفهوم "البيانات الضخمة" في الرأس يوجد غرفة ضخمة ، مزدحمة بالعديد من الخوادم مع الأضواء الساطعة. ولكن لفهم أن هذه ظاهرة مهمة حقًا غيرت قواعد اللعبة ، يكفي أن ننتقل إلى بعض الأمثلة.

لقد أظهرت الانتخابات الرئاسية الأمريكية الأخيرةمدى فعالية استخدام أحدث تقنيات المعلومات. في حين لجأت هيلاري كلينتون إلى الأساليب التقليدية واجتذبت المشاهير إلى مقرها ، قرر فريق دونالد ترامب التركيز على دراسة تفضيلات وسلوك المستهلك لملايين الأمريكيين. بعد تلقي بيانات دقيقة حول ما يريده الناخبون ، كان مقر المرشح الجمهوري قادرًا على الاستجابة بشكل أكثر فعالية لطلبات مستخدمي الإنترنت النشطين. نتيجة لذلك ، لا يبدو فوز ترامب غير متوقع إلى حد كبير إذا ما أخذ في الاعتبار مقدار العمل المثمر الذي تم إنجازه.

أو خذ ، على سبيل المثال ، خدمة بث Netflix ،التي أصبحت في السنوات الأخيرة واحدة من منتجي المحتوى الأكثر شعبية. من خلال تقديم مواد الفيديو إلى الجمهور ، تمكنت الشركة من تجميع كمية هائلة من البيانات الإحصائية ، ودراسة شاملة لتفضيلات المستخدمين: القصص التي يحبونها ، والممثلون الذين يحبونهم ، والمشاهد التي تتم مراجعتها عدة مرات ، والتي يتم تخطيها. نتيجةً لذلك ، تصل كل سلسلة Netflix جديدة إلى النقطة وتحصل على أعلى التصنيفات على IMDB. إذا كنت لا تزال تعتقد أن مفتاح النجاح هو موهبة المتسابقين في العرض ، فمن الأرجح أنك ساذج للغاية.

على نطاق مجهري ، يمكن للبيانات الكبيرةوضعت في خدمة تحسين نفسك. على سبيل المثال ، يمكن لسوار اللياقة أو الساعة الذكية جمع معلومات حول السعرات الحرارية المستهلكة والمسافة المقطوعة ومعدل ضربات القلب وإحصائيات النوم. سيسمح لك جمع وتحليل هذه المعلومات بضبط عاداتك ، والتي سيكون لها تأثير إيجابي على صحتك وطول العمر بالصبر المناسب.

بالمناسبة ، وعلى نطاق عالمي بيانات كبيرةمساعدة بنشاط الطب. بالفعل ، لا تسمح معالجة البيانات الإحصائية المتراكمة ، في بضع دقائق فقط ، بتشخيص مختلف الأمراض بدقة عالية ، ولكن أيضًا بالتنبؤ بفعالية بحدوثها. سيتعين على هذا حماية الناس من التهديد الخفي وإنقاذ ملايين الأرواح.

مثال حي على ذلك هو المنصةResearchKit ، التي أطلقتها شركة أبل في عام 2016. من خلال استخدام تطبيقات الهاتف المحمول ، يجمع المهنيون الطبيون بيانات صحة المستخدم. هذا لا يسمح فقط بتمديد رعاية المرضى خارج العيادة وضمان الشفاء العاجل ، ولكن أيضًا تجميع البيانات اللازمة لزيادة فعالية التفاعل مع المرضى في المستقبل.

بالطبع ، البيانات الكبيرة تستخدم بنشاط ووكالات إنفاذ القانون. على سبيل المثال ، تستخدم وكالة الأمن القومي الأمريكية البيانات المتاحة لاكتشاف ومنع النشاط الإرهابي. لطالما استخدمت الشركات حلولاً في هذا المجال لمنع الهجمات الإلكترونية والتطفل غير المصرح به على الأنظمة. تقوم الشرطة أيضًا بتجربة البيانات الضخمة ، في محاولة لتحديد التهديد المحتمل لحكم القانون للمواطن بناءً على معلومات من ملفات التعريف العامة.

سيكون من المفيد أن نتذكر الإرشاديةتاريخ عام 2014 ، عندما قامت شرطة شيكاغو ، باستخدام نظام كمبيوتر ، بتجميع قائمة تضم 400 من سكان المدينة الذين لديهم جميع المتطلبات اللازمة لخرق القانون. زارت الشرطة هؤلاء المواطنين وأجرت محادثات وقائية معهم ، لكن القصة أثارت الكثير من الضجيج ، ويعود السبب الرئيسي في ذلك إلى الغزو غير المتعمد للحياة الشخصية. على الرغم من أن المشروع مع الفضيحة قد تم إغلاقه ، لا يوجد دليل على أن تحليل الكمبيوتر للتوجهات الجنائية المحتملة للمواطنين قد توقف.

على الرغم من أن عصر البيانات الكبيرة لا يزال مستمرافي المرحلة الأولية ، يتم بالفعل استخدام إنجازات هذا النظام بشكل فعال من قبل كل من الشركات الخاصة والحكومات. ولكن الشيء الرئيسي هو أن هذه الأصول القيمة يجب ألا تكون تحت تصرف أولئك الذين يمكنهم استخدامها على حساب الإنسانية.

# الاتجاهات | الشبكات العصبية