общ

# тенденции | Големи данни

"Този, който притежава информацията, притежава света." Изглежда, че тази фраза никога не е звучала толкова вярно, колкото днес. През второто десетилетие на 21 век информацията се превърна не само в суровини, инструменти и оръжия, но и в най-важния актив, за който се борят корпорации и правителства. Ще поговорим за това днес.

</ P>

В съвременната бизнес среда, управление на данние критичен показател за успеха на едно предприятие. Много компании започнаха да признават значението на информационните умения. Днес така наречените „големи данни“ са най-важната тенденция, която се простира до най-разнообразните области на бизнеса и технологиите.

Използва се терминът "Големи данни".да се посочат инициативи и технологии, които включват разнообразни и бързорастящи активи на тези различни категории. Разнообразието от тази информация усложнява обработката им и тези, които успяват да направят това в полза на своя бизнес, днес са успешни.

Големите данни включват създаване на големи обемисложни данни, тяхното съхранение, извличане и анализ. Дисциплината "големи данни" се основава на принципа на три V - обем (обем), скорост (скорост) и разнообразие (разнообразие).

Сила на звука. Преди двадесет години редовен компютър имаше твърддиск със среден капацитет 10 гигабайта. Днес социалните платформи като Facebook обработват повече от половин милиард терабайта данни ежедневно. Самолетите на Boeing генерират стотици терабайти от полетни данни за един полет. Широкото използване на смартфони и таблети гарантира производството на милиарди терабайти постоянно актуализирана информация, която е толкова разнообразна и разнообразна, колкото и нашия свят.

Speed. Системи за проследяване на кликвания в Интернет всяка секундаанализирайте милиони уеб потребители. Промените в състоянието на търговия на фондовите борси се актуализират в рамките на микросекунди. Игралните сървъри могат да поддържат еднократната връзка на милиони потребители, които извършват много действия всяка секунда. Това са само няколко примера, които показват как неистово се генерират нови данни.

Разнообразие. Понятието "големи данни" не се прилагасамо букви и цифри: тя включва аудио, видео, разпръснат текст, данни от социалните мрежи и много други. И там, където някои виждат гигантско сметище от ненужна информация, други виждат безценен актив, който може да промени света.

Терминът Големи данни е въведен за първи път от главата.O'Reilly от Роджър Мугалус през 2005 г. Въпросът как да обработим наличните данни обаче започна да се задава много отдавна. Всъщност първите записи на опити за използване на данни за управление на дейностите на предприятията са на възраст над 7000 години.

Точно по това време Месопотамия започна да водисчетоводство за прибиране и отглеждане на добитък. Счетоводните принципи продължиха да се развиват и подобряват и през 1663 г. демографът Джон Грант започва да записва и анализира нивата на смъртност в Лондон. Той направи това така, че обществеността оцени степента на разпространение на бубонната чума в онези дни.

В книгата си Естествено и политическонаблюдение на списъците с мъртвите. ”Грант представи на света първия статистически анализ на данни. Книгата хвърли светлина върху основните причини за смъртта в Англия от 17 век. Благодарение на тази работа Грант стана известен като пионер в статистиката.

Оттогава принципите на счетоводството продължаватда се подобри, но нищо изключително в тази посока не се появи, докато в края на 19 век не обяви навлизането в информационната ера. Нова ера започва през 1889 г., когато Херман Холерит изобретява компютърна система за сортиране на данните от преброяването.

Следващият забележителен скок се случи през 1937 г.,когато президентът на САЩ беше Франклин Рузвелт. След като в Конгреса беше приет Законът за държавната сигурност, от правителството се изискваше да води записи на милиони американци. В резултат на това правителството поиска от IBM да разработи система за четене на перфокарти, която е проектирана да съхранява огромни количества данни.

Въпреки това, първата машина за обработка на даннисистемата Колос, която е разработена от британците през 1943 г. за дешифриране на нацистки кодове по време на Втората световна война, се счита за такава. Машината търси всякакви модели, които редовно се появяват в прихващани съобщения. Системата работеше с рекордна скорост и успя да обработи 5000 символа в секунда, което даде възможност за няколко часа да свърши работата, която преди отне седмици.

Първият център за данни е създаден от американецаправителството през 1965 г. и е било предназначено да съхранява милиони пръстови отпечатъци и данъчни записи. Записите са записани на магнитни ленти, които са систематизирани и се съхраняват в специално помещение. Смята се, че това е първото електронно хранилище на информация.

През 1989 г. британски специалист по компютърни наукиТим Бърнърс-Ли измисли световната компютърна мрежа с цел да осигури обмен на информация чрез хипертекстова система. Тогава той дори не можеше да си представи какво влияние ще има неговото изобретение върху света, който по-късно стана известен като Интернет. След началото на деветдесетте години все повече устройства започват да се свързват към глобалната мрежа, което означава, че скоростта на генериране на данни започва да расте още по-активно.

През 1995 г. е създаден първият суперкомпютър. Тази машина успя да свърши работата за секунди, което на обикновения човек би отнело хиляди години. И тогава дойде 21 век.

Тук отново се обръщаме към 2005 г., когатоРоджър Мугалус въведе термина "големи данни". През същата година Yahoo създаде вече отворената платформа Hadoop, чиято цел беше да индексира целия Интернет. Днес Hadoop се използва от милиони предприятия за получаване и обработка на огромни количества данни.

През последните 10 години социалните мрежи се развиват бързосе развива, а количеството информация, създавана от потребителите, нараства всеки ден. Една след друга компании и правителства започнаха да изпълняват проекти за големи данни. Например през 2009 г. правителството на Индия създаде най-голямата база данни от биометрични данни, която съхранява отпечатъци и сканиране на ирисите на очите на всички граждани на страната.

През 2010 г. изпълнителният директор на Google Ерик Шмид говориКалифорнийската конференция по технология, която казва, че през последните седем години компанията е натрупала 5 екзабайта данни. Малко вероятно беше той да си представи, че до 2017 г. всеки ден ще се генерира подобно количество информация. В същото време темповете на растеж не смятат да се забавят.

Погледът в миналото ни позволи да направим приблизителнопредстава какви тенденции ни очакват в бъдеще. Ако преди две десетилетия предприятията, които притежаваха информация, бяха най-успешни, то днес тези, които умеят най-добре да интерпретират и използват наличната информация, имат успех. Логично е да се очаква, че бъдещият успех ще зависи от способността за получаване на големи данни, които да помогнат за вземането на правилни стратегически решения.

Със сигурност повечето от нас при споменаванетоконцепцията за "големи данни" в главата има огромно помещение, препълнено с много сървъри с мигащи светлини. Но за да разберете, че това е наистина важно явление, което промени правилата на играта, достатъчно е да се обърнем към няколко примера.

Последните президентски избори в САЩ показахаколко ефективно може да бъде използването на най-новите информационни технологии. Докато Хилари Клинтън прибягва до традиционните методи и привлича известни личности в централата си, екипът на Доналд Тръмп реши да се съсредоточи върху изучаването на предпочитанията и потребителското поведение на милиони американци. След като получи точни данни какво иска електоратът, централата на републиканския кандидат успя да отговори по-ефективно на искания от активни потребители на Интернет. В резултат победата на Тръмп не изглежда толкова неочаквана, ако вземете предвид колко и продуктивна работа е свършена.

Или вземете например услугата за стрийминг Netflix,който през последните години се превърна в един от най-популярните производители на съдържание. Доставяйки видео материали на аудиторията, компанията успя да натрупа огромно количество статистически данни, старателно проучвайки предпочитанията на потребителите: кои истории харесват, кои актьори харесват, кои сцени преглеждат няколко пъти и кои пропускат. В резултат на това всяка нова серия Netflix стига до точката и печели най-високите оценки на IMDB. Ако все още смятате, че ключът към успеха е талантът на водещите на шоуто, тогава най-вероятно сте твърде наивен.

В микроскопичен мащаб големите данни могатпоставете в услуга на вашето самоусъвършенстване. Например, вашата фитнес гривна или smartwatch може да събира информация за консумираните калории, изминатите разстояния, сърдечната честота и статистиката за съня. Събирането и анализирането на такава информация ще ви позволи да коригирате навиците си, което с подходящо търпение ще има положителен ефект върху вашето здраве и дълголетие.

Между другото и в световен мащаб големи данниактивно помагат на медицината. Вече обработката на натрупаните статистически данни позволява не само за няколко минути да се диагностицират различни заболявания с висока точност, но и ефективно да се предскаже тяхното възникване. Това ще трябва да предпази хората от скритата заплаха и да спаси милиони животи.

Един ярък пример за това е платформатаResearchKit, която Apple стартира през 2016 г. Чрез използването на мобилни приложения медицинските специалисти събират данни за здравето на потребителите. Това позволява не само да се разшири грижата за пациентите извън клиниката и да се гарантира бързото им възстановяване, но и да се натрупат необходимите данни за повишаване на ефективността на взаимодействието с бъдещите пациенти.

Разбира се, големите данни се използват активно иправоприлагащи агенции. Например Агенцията за национална сигурност на САЩ използва налични данни за откриване и предотвратяване на терористична дейност. Корпорациите отдавна използват решения в тази област, за да предотвратят кибератаки и неправомерно проникване в системи. Полицията също експериментира с Big Data, опитвайки се да определи потенциалната заплаха за върховенството на закона на гражданин въз основа на информация от публични профили.

Ще бъде полезно да си припомним показателнитеисторията на 2014 г., когато полицията в Чикаго, използвайки компютърна система, състави списък от 400 жители на града, които имат всички предпоставки, за да нарушат закона. Полицията посети тези граждани и проведе превантивни разговори с тях, но историята вдигна много шум, предимно заради безцеремонното нашествие в личния живот. Въпреки че проектът със скандала беше затворен, няма доказателства, че компютърният анализ на потенциалните престъпни наклонности на гражданите е бил прекратен.

Въпреки че ерата на големите данни все още продължаваВ началния етап постиженията на тази дисциплина вече активно се използват както от частните корпорации, така и от правителствата. Но основното е, че този ценен актив не трябва да бъде на разположение на онези, които биха могли да го използват в ущърб на човечеството.

# тенденции | Невронни мрежи