خوشه بندی در OBIEE 12c

یکی از مسائلی که زیاد با آن روبرو بوده ام خوشه بندی است. نکته مهم و قابل ذکر اینکه چنانچه داده ها از نوع عددی باشند می توان از الگوریتم k-means استفاده کرد. برای مثال چنانچه انبارداده ما شامل مقادیری همچون وضعیت تاهل، سطح تحصیلات، وضعیت اعتبار و... باشد در این صورت مساله کمی پیچیده خواهد بود. در چنینی مواردی می توان از تکنیک one hot encoding استفاده کرد.

اتصال بین پایگاه داده اوراکل و R Language

برای برقراری اتصال بین پایگاه داده اوراکل و R Language و انتقال داده از پایگاه داده به محیط R Language به منظور پیاده سازی و اجرای تحلیل های آماری و داده کاوی، بسته های(Packages) زیر وجود دارد:

RODBC

RJDBC

RODM

و...

در این نوشتار قصد داریم بسته ROracle را معرفی کنیم. این بسته توسط تیم اوراکل توسعه یافته است. بنا بر آنچه که در سایت اوراکل آمده است این بسته در خواندن داده ها 72 برابر سریع تر از RJDBC و 2.5 برابر سریع تر از RODBC است. این بسته در نوشتن داده ها 61 برابر سریع تر از RJDBC و 630 برابر سریع تر از RODBC است. مهمترین دستور این بسته جهت اتصال به پایگاه داده اوراکل دستور زیر است:

Connection= dbConnect(dbDriver("Oracle")), "localhost:1521:sid", username = "system", password = "oracle")

معرفی Oracle SQL Developer

Oracle SQL Developer یک محیط توسعه یافته یکپارچه (IDE) برای کار کردن با دستورات SQL در پایگاه داده اوراکل است.

این IDE را می توانید به صورت رایگان استفاده کنید. از جمله امکانات این IDE امکان پیاده سازی الگوریتم های داده کاوی است. توجه داشته باشید برای این منظور باید نسخه پایگاه داده 11.2.1.0.4 به بالا باشد. همچنین SH Schema نیز نصب شده باشد.