Main

What REALLY is Data Science? Told by a Data Scientist

Interested in Data Science? Start with learning SQL to query data. You'll need it no matter which part of the data science pyramid you're interested in: https://joma.tech/sql HOW DO I GET A TECH JOB? ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀ 📚 Video courses from JomaClass: 🎓 New to programming? Learn Python here: https://bit.ly/joma_python 🎓 Learn SQL for data science and data analytics: https://bit.ly/joma_sql 🎓 Data Structures and Algorithms: https://bit.ly/joma_dsa 💼 Resume Template and Cover letter I used for applying to software internships and full-time jobs: https://resume.joma.io 💼 Interviewing for jobs now? Get access to interview question database, courses, coaching, and peer community today: https://www.tryexponent.com/?ref=joma 📱 SOCIAL MEDIA ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀ https://www.instagram.com/jomakaze/ https://twitter.com/jomakaze https://www.facebook.com/jomakaze Some of the links in this description are affiliate links that I get a kickback from

Joma Tech

5 years ago

لا يتعلق علم البيانات بصنع نماذج معقدة. الأمر لا يتعلق بعمل تصورات رائعة الأمر لا يتعلق بكتابة علم بيانات الكود ، فهو يتعلق باستخدام البيانات لإنشاء أكبر قدر ممكن من التأثير لشركتك الآن يمكن أن يكون التأثير في شكل أشياء متعددة يمكن أن يكون في شكل رؤى في شكل منتجات البيانات أو في شكل توصيات المنتج للشركة الآن للقيام بهذه الأشياء ، فأنت بحاجة إلى أدوات مثل صنع نماذج معقدة أو تصورات للبيانات أو كتابة التعليمات البرمجية ولكن في الأساس كعالم البيانات مهمتك هي حل مشاكل الشركة الحقيقية باستخدام البيانا
ت وأي نوع من الأدوات التي تستخدمها لا يهمنا الآن هناك الكثير من المفاهيم الخاطئة حول علم البيانات ، خاصة على YouTube وأعتقد أن السبب في ذلك هو وجود اختلال كبير بين ما يحظى بشعبية للحديث وما هو مطلوب في هذه الصناعة. ولهذا السبب أريد أن أوضح الأمور. أنا أنا عالم بيانات يعمل لشركة GAFA و تؤكد تلك الشركات حقًا على استخدام البيانات لتحسين منتجاتها لذلك هذا هو بلدي يأخذ على ما هو علم البيانات قبل علم البيانات ، قمنا بتعريف مصطلح استخراج البيانات في مقال يسمى من التنقيب عن البيانات إلى اكتشاف المعرفة ف
ي قواعد البيانات في 1996 حيث أشار إلى العملية الشاملة لاكتشاف معلومات مفيدة من البيانات في عام 2001 ، أراد وليام كليفلاند جلب تعدين البيانات إلى مستوى آخر لقد فعل ذلك من خلال الجمع بين علوم الكمبيوتر واستخراج البيانات في الأساس لقد جعل الإحصائيات تقنية أكثر بكثير مما اعتقد أنه سيوسع من إمكانيات استخراج البيانات وينتج قوة قوية للابتكار الآن يمكنك الاستفادة من حساب القوة للإحصاءات ودعا هذا علم البيانات التحرير والسرد. في حوالي مثل هذا الوقت يحدث هذا أيضًا عندما ظهر الويب 2.0 حيث لم تعد المواقع الإ
لكترونية مجرد كتيب رقمي ، ولكنها وسيلة للتجربة المشتركة بين الملايين والملايين من المستخدمين هذه هي مواقع الويب مثل MySpace في عام 2003 Facebook في 2004 و YouTube في 2005. يمكننا الآن التفاعل مع هذه المواقع مما يعني أنه يمكننا المساهمة في نشر تعليق مثل مشاركة التحميل ترك بصمتنا في المشهد الرقمي نسميه الإنترنت وتساعد على إنشاء وتشكيل النظام البيئي نحن نعرف الآن ونحب اليوم. وتخيل ماذا؟ هذا كثير من البيانات الكثير من البيانات ، وأصبح التعامل معها باستخدام التقنيات التقليدية أكثر من اللازم. لذلك نحن
نسمي هذه البيانات الكبيرة. هذا فتح عالم من الاحتمالات في العثور على رؤى باستخدام البيانات ولكن هذا يعني أيضًا أن أبسط الأسئلة تتطلب بنية تحتية متطورة للبيانات فقط لدعم معالجة البيانات نحن بحاجة إلى تكنولوجيا الحوسبة المتوازية مثل MapReduce و Hadoop و Spark حتى ظهور البيانات الكبيرة في أثار عام 2010 ظهور علم البيانات لدعم احتياجات الشركات لاستخلاص رؤى من مجموعات البيانات الضخمة غير المنظمة إذن ، وصفت مجلة علم البيانات علم البيانات على أنه كل شيء تقريبًا له علاقة بالبيانات جمع تحليل النمذجة. بعد
الجزء الأكثر أهمية هو تطبيقاتها. جميع أنواع التطبيقات. نعم ، كل أنواع التطبيقات مثل التعلم الآلي حتى في عام 2010 مع وفرة جديدة من البيانات جعلت من الممكن لتدريب الآلات مع نهج يحركها البيانات بدلا من نهج المعرفة مدفوعة. أصبحت جميع الأوراق النظرية حول الشبكات العصبية المتكررة التي تدعم الآلات المتجهة ممكنة شيء يمكن أن يغير الطريقة التي نعيش بها وكيف نختبر الأشياء في العالم لم يعد التعلم العميق مفهومًا أكاديميًا في ورقة البحث هذه أصبح فئة مفيدة ملموسة من التعلم الآلي التي من شأنها أن تؤثر على حياتن
ا اليومية لذا سيطر التعلم الآلي و الذكاء الاصطناعي على وسائل الإعلام التي تلقي بظلالها على كل الجوانب الأخرى لعلوم البيانات مثل التحليل الاستكشافي ، التجريب ، ... والمهارات التي نسميها عادة ذكاء الأعمال حتى الآن الجمهور العام يفكر في علم البيانات كما ركز الباحثون على التعلم الآلي والذكاء الاصطناعى ولكن الصناعة تقوم بتعيين علماء البيانات كمحللين لذلك هناك اختلال هناك سبب الاختلال هو أن نعم ، يمكن لمعظم علماء البيانات أن يعملوا على حل مشكلات فنية أكثر لكن الشركات الكبرى مثل Google Facebook Netflix
لديها الكثير من الفواكه المنخفضة المعلقة لتحسين منتجاتها بحيث لا تتطلب أيًا منها تعلم الآلة المتقدمة أو المعرفة الإحصائية للعثور على هذه الآثار في تحليلهم كونك عالم بيانات جيدًا لا يتعلق بمدى تقدم نماذجك إنها تدور حول مدى تأثيرك على عملك. أنت لست من محبي البيانات. أنت مشكلة حلال أنت استراتيجيون. ستعطيك الشركات أكثر المشاكل غموضًا وصعوبة. ونتوقع منك أن توجه الشركة إلى الاتجاه الصحيح حسنًا ، أريد الآن أن أختتم أمثلة واقعية عن وظائف علم البيانات في وادي السيليكون لكن أولاً يجب علي طباعة بعض الرسوم
البيانية. لذلك دعونا نذهب نفعل ذلك (محادثة لا تتعلق مباشرة بالموضوع) (محادثة لا تتعلق مباشرة بالموضوع) إذاً هذا مخطط مفيد جدًا يخبرك باحتياجات علم البيانات. الآن ، هو واضح جدا لكن في بعض الأحيان ننسى الأمر الآن في الجزء السفلي من الهرم الذي نجمعه ، من الواضح أنه يتعين عليك جمع نوع من البيانات لتتمكن من استخدام هذه البيانات لذا فإن جمع تخزين تحويل كل هذه الجهود لهندسة البيانات أمر مهم للغاية وهو فعال في الواقع يتم التقاطها بشكل جيد في الوسائط بسبب البيانات الضخمة التي تحدثنا عنها حول مدى صعوبة إ
دارة جميع هذه البيانات تحدثنا عن الحوسبة المتوازية التي تعني مثل Hadoop و Spark أشياء من هذا القبيل. نحن نعرف عن هذا. الآن الشيء الأقل شهرة هو الأشياء الموجودة هنا كل شيء هنا و من المدهش أن هذا هو في الواقع أحد أهم الأمور بالنسبة للشركات لأنك تحاول إخبار الشركة ماذا تفعل مع المنتج الخاص بك. إذن ماذا أقصد بذلك؟ لذلك أنا تحليلات يخبرك باستخدام البيانات ، ما نوع الرؤى التي يمكن أن تخبرني بما يحدث للمستخدمين ، ثم يعد هذا الأمر مهمًا ما الذي يحدث مع المنتج الخاص بي؟ كما تعلمون ، ستخبرك هذه المقاييس م
ا إذا كنت ناجحًا أم لا. وبعد ذلك أيضًا ، أنت تعرف أن يكون اختبارًا بالطبع التجربة التي تسمح لك بمعرفة أي إصدارات المنتج هي الأفضل إذاً هذه الأشياء مهمة حقًا لكنها غير مغطاة في وسائل الإعلام. ما هو مغطى في وسائل الإعلام هل هذا الجزء منظمة العفو الدولية ، التعلم العميق. لقد سمعنا ذلك وعلى ذلك ، كما تعلمون ولكن عندما تفكر في ذلك لشركة ، للصناعة ، إنه في الواقع ليس أولوية قصوى أو على الأقل ليس الشيء الذي يحقق أكبر نتيجة بأقل قدر من الجهد هذا هو السبب في أن التعلم المتعمق الذكاء الاصطناعي يتصدر التسل
سل الهرمي للاحتياجات وقد تكون هذه الأشياء بمثابة اختبار تحليلي انهم في الواقع وسيلة أكثر أهمية للصناعة لهذا السبب نحن نوظف الكثير من علماء البيانات الذين يقومون بذلك. فماذا فعل علماء البيانات في الواقع؟ حسنًا ، هذا يعتمد على الشركة بسبب حجمها لذلك بالنسبة للشركات الناشئة ، فأنت تفتقر إلى الموارد لذلك يمكنك فقط الحصول على نوع DS واحد. بحيث عالم البيانات واحد عليه أن يفعل كل شيء. لذلك قد تكون رؤية كل هذا كونها علماء البيانات. ربما لن تقوم بعمل الذكاء الاصطناعى أو التعلم العميق لأن هذا ليس أولوية ا
لآن ولكن قد تكون تفعل كل هذه. يجب عليك إعداد البنية الأساسية للبيانات بالكامل قد تضطر حتى إلى كتابة بعض التعليمات البرمجية البرمجية لإضافة تسجيل ثم عليك القيام بالتحليلات نفسك ، ثم عليك بناء المقاييس بنفسك ، وعليك أن تفعل A / B اختبار نفسك. لهذا بالنسبة للشركات الناشئة إذا احتاجوا إلى عالم بيانات فإن هذا الأمر برمته علم البيانات ، وهذا يعني أن عليك أن تفعل كل شيء. ولكن دعونا ننظر إلى الشركات المتوسطة الحجم. الان اخيرا لديهم الكثير من الموارد. يمكنهم فصل مهندسي البيانات وعلماء البيانات لذلك عادة
في المجموعة ، وهذا ربما هندسة البرمجيات. و ثم هنا ، سيكون لديك مهندسي بيانات يقومون بذلك. ثم حسب ما إذا كنت شركة متوسطة الحجم تفعل الكثير نماذج التوصية أو الأشياء التي تتطلب AI ، ثم DS سوف تفعل كل هذه حق. لذلك كعالم بيانات ، يجب أن تكون أكثر تقنية بكثير لهذا السبب يقومون بتوظيف أشخاص يحملون شهادات الدكتوراه أو الماجستير لأنهم يريدون منك أن تكون قادرًا على القيام بالأشياء الأكثر تعقيدًا لذلك دعونا نتحدث عن شركة كبيرة الآن لأنك تكبر كثيرًا ربما لديك الكثير من المال ومن ثم يمكنك إنفاق المزيد على ال
موظفين لذلك يمكن أن يكون لديك الكثير من الموظفين المختلفين الذين يعملون على أشياء مختلفة. بهذه الطريقة لا يحتاج الموظف إلى التفكير في هذه الأشياء التي لا يريدون القيام بها ويمكنهم التركيز على الأشياء التي يريدونها الأفضل في. على سبيل المثال ، أنا وشركتي الكبيرة بدون عنوان سأكون في التحليلات حتى أتمكن فقط من تركيز عملي على التحليلات والمقاييس وأشياء من هذا القبيل لذلك لا داعي للقلق حول هندسة البيانات أو الذكاء الاصطناعي العميق لذلك هنا كيف تبدو لشركة كبيرة أجهزة استشعار تسجيل مفيدة. كل هذا يتم مع
الجته بواسطة مهندسي البرمجيات حق؟ ثم هنا ، تنظيف وبناء خطوط أنابيب البيانات هذا هو لمهندسي البيانات. الآن هنا ، بين هذين الأمرين ، لدينا بيانات تحليلات العلوم. هذا ما يطلق عليه ولكن بمجرد أن نذهب إلى الذكاء الاصطناعي والتعلم العميق ، هذا هو المكان الذي لدينا علماء البحوث أو نسميها علم البيانات الأساسية ويدعمهم والآن المهندسين الذين هم مهندسي التعلم الآلي. بلى على أي حال ، هكذا باختصار ، كما ترون ، يمكن أن يكون علم البيانات كل هذا ويعتمد على الشركة التي تعمل فيها التعريف سوف يختلف. لذا ، اسمحوا ل
ي أن أعرف ما الذي ترغب في معرفة المزيد حول التعلم العميق AI ، أو اختبار A / B ، التجريب ، ... اعتمادا على ما تريد أن تتعلم عنه اترك تعليقًا لأسفل أدناه حتى أتمكن من التحدث عن ذلك أو يمكنني العثور على شخص يعرف هذا ويمكنني مشاركة رؤى معك لذا ، نعم ، إذا أعجبك هذا الفيديو ، فلا تنسى الإعجاب والاشتراك إذن أجل. اتمنى ان تحظا بيوم رائع. آمل أن يكون هذا مفيدًا. ولكن نعم ، شكرا للمشاهدة سلام.

Comments

@kevind97

As a current college student, I really appreciate the breakdown of the different roles and responsibilities for Data Science. Keep up the good work and I would love to learn more about DS.

@justindulay2536

these are what i watch when im depressed about my career at 1am

@liamw7565

Can we talk about the fact that he drove to the office to print off a chart and then FedEx it to himself 😂

@fox_trot

Days worth of knowledge compressed in 11 minutes. Why isn't the world of youtube more like you. Thank you Joma.

@shupesmerga4694

Word: Data Scientist Description: Data Scientist are people who uses data to create impact for the organization through insights, product recommendation and etc. Where to find a Data Scientist: You will often see data scientist in public places like bridges, if there are too many people in the bridge, look for the person dancing goofily. That's the data scientist.

@astarkdan

I've been interested in the term "data science" and what it could mean for me, my hobbies and career, and your video has been a brilliant introduction. Thank you!

@Promar22

Could you do a video showing some actual day to day activities on the job. Basically putting some of the things videos mentioned into context with some real life examples would be great (I understand this may be tough because of company rules on privacy/security etc) but anything of the sort is appreciated!

@saharshpoddar8261

I'm a college student wanting to explore this field. You're been a great help. I'd love to watch ur videos on the breakdown of the buzzwords...ml, ai, deep learning, neural networks etc... btw loved the video.

@datalover_ryan

Wonderful! I agree your point that there is huge gap between hot “AI” “ML” and what industries need. GAFA born with data, and of course targeting the top of your triangle of needs. Most of the other industries and public sector still are still looking at the static reports. They need the correct ways to do data analytics, rather than chase “data science”. I just uploaded a case study demo of data analytics for normal company’s normal process.

@cadmus6397

I wish I saw this 6 months ago! I've been trying to transition careers from physics to "data science" and after not having much luck despite what I thought to be very similar methods used in my former career, now its becoming clear why my resume is getting nowhere... I've focused on the top too much, haven't showcased my whole pyramid. Thank you bro!

@Rzrizaldy

Completely agree, as a data scientist in telco company most of time what i needed i just SQL to retrieve data, Tableau to make quick insight, Python with Jupyter Notebook to build model and experiment with dataset after assessing from data insight and business knowledge.

@SashaInTheCloud

Consistent nomenclature would be amazing, but startups are such havoc on that notion! Thanks for breaking down the startup vs midsize vs deep pocket lingo. It's easier to guess the actual role scope by company size and industry with a good breakdown like this.

@derrickwillingham4596

“What tools do you use... we don’t care” <- most relevant comment I’ve seen on a data science video. Great video!

@issueBucks

"Thanks for driving...." "Shut the f*ck up" I am subscribing because of that statement.

@strawberrywitcoco

Today I learned that I want to forever learn and become a research scientist

@BlueWithoutBiu

Such a concise, easy to understand, and thorough explanation you've got there. It can be understood clearly by someone like me, with no prior knowledge of what data science is and what it entails. Great content!

@magefront1485

At my line of job, there is no DS, just SQL kids, any model that is not linear regression or contains more than 2 params is beyond the knowledge of the manager.

@arsnakehert

I thought this would've been a Joma meme video and was surprised by how unironically helpful it is

@athenasalomons5847

This is definitely the most helpful video I’ve seen. Especially the hierarchy of needs for small, medium, and large companies! Thank you Joma.

@yesreally623

It's a breath of fresh having someone so simply express the breadth of this career field. An onslaught of technical terms do little but confuse the curious. I will now quote mine Einstein: “If you can't explain it to a six year old, you don't understand it yourself.” Good video friend!