I'm Yousef Al-Zahrani — a Data Engineer and Analyst turning raw, messy information into decisions, dashboards, and production-grade pipelines. Medallion architectures. Azure. Microsoft Fabric. Python. Where data ends, insight begins. أنا يوسف الزهراني — مهندس ومحلل بيانات أُحوّل المعلومات الخام والمشتتة إلى قرارات ولوحات معلومات وخطوط بيانات جاهزة للإنتاج. معمارية Medallion. Azure. Microsoft Fabric. Python. حيث تنتهي البيانات، تبدأ الرؤية.
A Data Science graduate (Class of May 2026) who builds end-to-end data systems — from ingestion and ETL to BI dashboards and ML deployment.
During my 6-month internship at King Fahad Medical City, I cleaned and modelled large-scale clinical datasets, built SQL-based ETL workflows, and shipped Power BI dashboards that informed decisions across multiple hospital departments.
I then layered on 180+ hours of intensive, project-based training at Athar Academy — mastering Microsoft Fabric, Azure, Airflow, Kafka, Spark, Hadoop, and MongoDB, and building production-style pipelines with full Medallion architecture.
My mission: designing scalable data architectures that translate directly into measurable business outcomes. Every pipeline I build answers a question someone is paying for.
خريج علم بيانات (دفعة مايو ٢٠٢٦) متخصص في بناء أنظمة بيانات متكاملة — من الاستقبال ومعالجة ETL وصولاً إلى لوحات ذكاء الأعمال ونشر نماذج تعلم الآلة.
خلال تدريبي الذي استمر ٦ أشهر في مدينة الملك فهد الطبية، قمت بتنظيف ونمذجة مجموعات بيانات سريرية ضخمة، وبنيت خطوط ETL باستخدام SQL، وأطلقت لوحات Power BI ساعدت في اتخاذ القرارات عبر عدة أقسام في المستشفى.
ثم أكملت ١٨٠+ ساعة من التدريب المكثف القائم على المشاريع في أكاديمية أثر — متقناً Microsoft Fabric وAzure وAirflow وKafka وSpark وHadoop وMongoDB، وبنيت خطوط بيانات إنتاجية بمعمارية Medallion كاملة.
هدفي: تصميم بُنى بيانات قابلة للتوسع تُترجم مباشرة إلى نتائج أعمال قابلة للقياس. كل خط بيانات أبنيه يُجيب عن سؤال يستحق أن يُدفع من أجله.
An AI-powered diagnostic web platform. Users upload wound images; a CNN classifies risk tier (Low/Med/High) and surfaces health insights. Three-tier architecture — React frontend, FastAPI backend, TensorFlow model server over REST. HIPAA/GDPR-aligned data handling. منصة تشخيصية ذكية على الويب. يرفع المستخدم صورة الجرح، ويُصنّفه نموذج CNN حسب درجة الخطورة (منخفضة / متوسطة / عالية) ويقدم رؤى صحية. معمارية ثلاثية الطبقات — واجهة React، خلفية FastAPI، ونموذج TensorFlow عبر REST. معالجة بيانات متوافقة مع HIPAA و GDPR.
View repository زيارة المستودع ↗Production-style data platform with full Bronze/Silver/Gold architecture. Orchestrated ingestion with Kafka + Airflow, Spark transformations, and curated analytical marts published into Fabric Lakehouse with governance baked in. منصة بيانات بأسلوب إنتاجي بمعمارية Bronze/Silver/Gold كاملة. تنسيق الاستقبال عبر Kafka و Airflow، تحويلات Spark، ومستودعات تحليلية منسقة تُنشر في Fabric Lakehouse مع تطبيق الحوكمة.
Case study دراسة الحالة ↗End-to-end BI solution built during my internship. SQL-based ETL workflows feeding Power BI dashboards used across multiple hospital departments for KPI tracking, operational reporting, and executive-level decision-making. حل ذكاء أعمال متكامل تم بناؤه خلال فترة التدريب. خطوط ETL باستخدام SQL تُغذي لوحات Power BI المستخدمة في أقسام مستشفى متعددة لتتبع مؤشرات الأداء، التقارير التشغيلية، واتخاذ القرارات التنفيذية.
Internship deliverable مُسلَّم التدريب ↗Optimized a legacy reporting stack by rebuilding query logic with CTEs, window functions, and proper indexing — turning multi-minute runs into sub-second responses. Served as the analytical backbone for the KFMC dashboards above. تحسين نظام تقارير قديم بإعادة بناء منطق الاستعلامات باستخدام CTEs ودوال النافذة والفهرسة المناسبة — تقليل أوقات التنفيذ من دقائق إلى أقل من ثانية. شكّل العمود الفقري التحليلي للوحات KFMC أعلاه.
Part of KFMC stack جزء من منظومة KFMC ↗Exploratory analysis on anonymized clinical data using Pandas, NumPy, Matplotlib, and Seaborn. Outlier detection, correlation mapping, and feature engineering that fed directly into downstream ML pipelines built in Scikit-learn. تحليل استكشافي لبيانات سريرية مجهولة الهوية باستخدام Pandas و NumPy و Matplotlib و Seaborn. كشف القيم الشاذة، وخرائط الارتباط، وهندسة الخصائص التي غذّت خطوط تعلم الآلة اللاحقة المبنية بـ Scikit-learn.
Bootcamp deliverable مُسلَّم المعسكر ↗Event-driven pipeline built with Kafka topics, Spark Structured Streaming, and checkpointing on Azure Data Lake. Ingests simulated telemetry, enriches in near real time, and lands clean data in the Silver layer for analytical consumption. خط بيانات مدفوع بالأحداث مبني باستخدام Kafka Topics و Spark Structured Streaming والتحقق من النقاط على Azure Data Lake. يستقبل بيانات تليميترية محاكاة، يُثريها فوراً تقريباً، ويُنزل البيانات النظيفة في طبقة Silver للاستهلاك التحليلي.
Bootcamp capstone مشروع ختامي للمعسكر ↗Forecasting sandbox comparing classical ARIMA models against gradient-boosted learners on hospital operational KPIs. Includes proper walk-forward validation, residual diagnostics, and a simple deployment stub for scheduled predictions. بيئة اختبار للتنبؤ تقارن نماذج ARIMA الكلاسيكية مع نماذج gradient boosting على مؤشرات الأداء التشغيلية للمستشفى. تتضمن التحقق الزمني المتقدم، وتشخيص البواقي، ونموذج نشر بسيط للتنبؤات المجدولة.
Personal R&D بحث وتطوير شخصي ↗Geo-spatial analytics module layering demand signals over a regional grid. Parses geo-tagged events, aggregates into H3-style cells, and feeds Power BI with a custom map visual driven by DAX measures. وحدة تحليلات جغرافية مكانية تضع إشارات الطلب فوق شبكة إقليمية. تُحلّل الأحداث المُعلَّمة جغرافياً، وتجمعها في خلايا بأسلوب H3، وتُغذي Power BI بمرئية خريطة مخصصة مدفوعة بمقاييس DAX.
Analytics study دراسة تحليلية ↗Mastered Advanced Excel, SQL, Power BI, DAX, and Microsoft Fabric. Delivered projects in data modeling, star-schema design, KPI analysis, and advanced dashboarding. إتقان Advanced Excel و SQL و Power BI و DAX و Microsoft Fabric. تنفيذ مشاريع في نمذجة البيانات، تصميم مخطط النجمة، تحليل مؤشرات الأداء، واللوحات المتقدمة.
60+ hours of hands-on Python with NumPy, Pandas, Matplotlib, Seaborn, and Scikit-learn. Delivered projects in data wrangling, EDA, advanced visualization, and ML fundamentals. ٦٠+ ساعة تدريب عملي على Python مع NumPy و Pandas و Matplotlib و Seaborn و Scikit-learn. مشاريع في معالجة البيانات والتحليل الاستكشافي والتصور المتقدم وأساسيات تعلم الآلة.
Built production-grade pipelines on Microsoft Fabric, Azure, Airflow, Kafka, Spark, Hadoop, and MongoDB. Implemented Data Warehousing, Lakehouse, and Medallion architectures with end-to-end orchestration. بناء خطوط بيانات إنتاجية على Microsoft Fabric و Azure و Airflow و Kafka و Spark و Hadoop و MongoDB. تطبيق معماريات Data Warehousing و Lakehouse و Medallion مع تنسيق متكامل.
Cleaned and validated large-scale medical datasets with Python & Advanced Excel; shipped Power BI dashboards and SQL-based ETL workflows that informed decisions across multiple hospital departments. تنظيف والتحقق من صحة مجموعات بيانات طبية كبيرة باستخدام Python و Advanced Excel؛ وتسليم لوحات Power BI وخطوط ETL بـ SQL ساهمت في اتخاذ القرارات عبر عدة أقسام في المستشفى.
Relevant coursework: Data Structures, Databases, Machine Learning, Statistics, Big Data Analytics. المقررات ذات الصلة: هياكل البيانات، قواعد البيانات، تعلم الآلة، الإحصاء، تحليلات البيانات الضخمة.
Open to Data Engineer and Data Analyst roles across Saudi Arabia and remote. I reply fast and I build faster. متاح لوظائف مهندس ومحلل بيانات في المملكة العربية السعودية وعن بُعد. أرد بسرعة، وأبني أسرع.