ساره واحدی

ساره واحدی هستم؛ دانشجوی پانزدهمین دوره "علم داده" در آکادمی دایکه، دانشجوی کارشناسی ارشد فیزیک و علاقمند به کار کردن با دیتاها

بررسی کیفیت داده ها در نرم افزار

در این بخش از درس با یک نمونه دیتاست که قبلا نیز با آن آشنا شده ایم مباحثی که در این هفته یاد گرفته ایم را پیاده سازی می کنیم. در پایان این ویدیو انتظار می رود با مباحث اشاره شده در نقشه مفهومی زیر آشنایی داشته باشید و بتوانید آن را پیاده سازی نمایید.

بررسی کیفیت داده ها در نرم افزار Read More »

نرمال سازی داده ها

نرمال سازی داده ها که عموماً بر روی متغیر های کمی انجام می شود با دو هدف انجام می شود: ۱-هم مقیاس کردن داده های کمی ۲- تغییر در توزیع آماری و کاهش چولگی نرمال سازی داده ها (Normalization) – هم مقیاس سازی نرمال سازی یکی از تکنیک های مقیاس بندی ( Scaling )، نگاشت

نرمال سازی داده ها Read More »

استخراج ویژگی

استخراج ویژگی

استخراج ویژگی (Feature extraction) فرایندی است که در آن با انجام عملیاتی بر روی داده‌ها، ویژگی‌های بارز و تعیین‌کننده آن داده ها استخراج می‌شود. هدف استخراج ویژگی این است که داده‌های خام به شکل قابل استفاده‌تری برای پردازش‌های آماری بعدی درآیند. در تکنیک های استخراج ویژگی، با ایجاد ترکیب های خطی از ویژگی های اولیه،

استخراج ویژگی Read More »

پیاده سازی

پیاده سازی انتخاب ویژگی در نرم افزار

در این بخش از آموزش به پیاده سازی Feature Selection در دیتاست Bankloan می پردازیم و خواهیم دید که در نرم افزار IBM SPSS Modeler چگونه باید ویژگی های مهمی که در تحلیل این داده به ما کمک خواهند کرد را شناسایی کنیم. همچنین خواهیم آموخت که چگونه برآیند اهمیت فیلد ها را از طریق

پیاده سازی انتخاب ویژگی در نرم افزار Read More »

انتخاب ویژگی

انتخاب ویژگی

همانطور که در ابتدای مباحث داده کاوی اشاره شده یکی از روش های شناخت و آماده سازی داده ها، کاهش ابعاد و انتخاب نمونه است. کاهش ابعاد تبدیلی است که در آن سعی می شود از تعداد متغیر ها کاسته شود. در این روش اقدام به حذف فیلد های نا مرتبطی که ارزش تحلیلی ندارند

انتخاب ویژگی Read More »

هموارسازی داده ها

هموارسازی داده ها

کاربرد هموارسازی داه ها: در طبیعت و دنیای اطراف ما، پدیده‌هایی وجود دارند که با طول زمان دچار تغییر می‌شوند. این تغییرات می‌تواند به عوامل مختلفی وابسته باشد. گاهی ممکن است یک روند صعودی (یا نزولی) در تغییرات مربوط به ویژگی‌های یک پدیده مشاهده شود یا تغییرات فصلی باعث پدید آمدن تفاوت و اختلاف شود.

هموارسازی داده ها Read More »

تجمیع داده ها

تجمیع و فشرده سازی (Aggregation) تجمیع داده ها با ترکیب دو یا چند رکورد داده و خلاصه سازی آنها با اهداف زیر انجام میشود: ۱. تغییر مقیاس و زاویه نگاه به داده ها به طور مثال با تجمیع داده های مشتریان بانک به تفکیک هر شعبه می توان زاویه نگاه تحلیل را از سطح مشتری

تجمیع داده ها Read More »

SPSS Modeler پیاده سازی رگرسیون خطی

اجرای تبدیل داده ها در نرم افزار

در این ویدیو با استفاده از پروژه ای که قبلا بر روی فایل Bankloan تعریف کرده ایم مباحثی که در خصوص تبدیل داده ها آموختیم را پیاده سازی می نماییم. در این قسمت از تکنیک های نرمال سازی، ساخت ویژگی و گسسته سازی  (دانش زمینه ای و روش های نظارت شده و نظارت نشده) استفاده

اجرای تبدیل داده ها در نرم افزار Read More »

گسسته سازی

گسسته سازی

روش (Discretization / Binning) گسسته سازی به فرآیند تبدیل داده های پیوسته به مقادیر گسسته در قالب فواصل مجاوری که داده های پیوسته را درون خود قرار داده است، گفته می شود. در صورتی که طیف اعداد ورودی بسیار متنوع باشد (برای نمونه داده‌های مربوط به حقوق کارکنان)، در این حالت می‌توان طبقه‌هایی را برای

گسسته سازی Read More »

ساخت ویژگی

ساخت ویژگی

یکی از رایج ترین مراحل آماده سازی داده ها، ساخت ویژگی های جدید و اثربخش برای ورود به مدل ها می باشد. این مرحله به عنوان فرآیند شاخص سازی با اهداف مختلفی همچون تفسیرپذیری، تعمیم پذیری، افزایش کارایی مدل ها و … در داده های خام انجام می شود که شامل رویکردهای زیر می باشد:

ساخت ویژگی Read More »

درخواست مشاوره رایگان ×

    Call Center
    سبد خرید شما
    هیچ محصولی در سبد خرید نیست.

    ورود به حساب کاربری

    ساخت حساب کاربری

    Prove your humanity: 3   +   2   =