مترجم : آزاده رضازاده همدانی

برنامه نویسی در حوزه علوم داده, به یک زبان منعطف اما همه جانبه نیاز دارد تا در حین کدنویسی آسان, قدرت پردازش محاسبات پیچیده ریاضی را داشته باشد. پایتون مناسب­ترین زبان برای برآورده کردن نیاز­های فوق الذکر می­باشد زیرا تا کنون توانایی­های خود را علاوه بر برنامه نویسی همگانی در برنامه نویسی علمی و تخصصی نیز به اثبات رسانیده است. علاوه بر آن به طور مداوم کتابخانه­های خود را به منظور برطرف کردن نیازهای برنامه نویسی ارتقا می­دهد. در ادامه پیرامون تعدادی از ویژگی­های پایتون که آن را به زبان محبوب در حوزه علوم داده تبدیل کرده است صحبت می­شود:

·        یک زبان برنامه نویسی ساده و در عین حال با امکان یادگیری راحت که درمقایسه با زبان­های مشابه مانند R به تولید خطوط کد کمتر برای تولید نتیجه نیازمند است. سادگی این زبان برنامه نویسی باعث می­شود تا قادر باشد مسایل پیچیده را با کمترین میزان کد و همچنین کمترین اشفتگی و بهم ریختگی در روند برنامه اجرا نماید.

·        یک کد یکسان در محیط های متنوع برنامه نویسی بدون هیچگونه تغییری قابل اجرا است.

·        در مقایسه با سایر زبان­های برنامه نویسی تحلیل داده ازجمله R و MAtlab از سرعت بالاتری برخوردار است.

·        توانایی بالای آن در مدیریت حافظه مخصوصا garbage collection این امکان را ایجاد نموده است که به ابزاری قدرتمند در زمینه تبدیل, قطعه بندی, بصری سازی,.. داده­های حجیم مبدل شود.

·        زبان پایتون شامل مجموعه عظیمی از کتابخانه های موردنیاز تحلیل داده را دارا می­باشد.به طور مثال آررایه موجود در کتابخانه  NUMPY در محاسبات علمی به حافظه کمتری نسبت به داده list که برای نگهداری دادهای عددی در پایتون تعریف شده است, نیازمند است.

·        در پایتون package هایی وجود دارد که امکان اجرای کدهایی به زبان C و یا Java را می­دهد. که این امر باعث کاراتر شدن کد و استفاده از سایر کدهای موجود در سایر زبانها می-باشد.

در بخش­های بعدی چگونگی استفاده از ویژگیهای پایتون را در حل مسایل متفاوت در حوزه علوم داده مشاهده خواهید نمود.