در گفت وگو با ایسنا اعلام شد

اضافه شدن بخش های ترجمه و نقشه به جویشگر پارسی جو، تدوین نقشه راه اینترنت اشیا

اضافه شدن بخش های ترجمه و نقشه به جویشگر پارسی جو، تدوین نقشه راه اینترنت اشیا

به گزارش دانلود فایل معاون پژوهشكده IT پژوهشگاه ارتباطات و فناوری اطلاعات از اضافه شدن قابلیت های موتور جستجوی ˮپارسی جوˮ اطلاع داد و اظهار داشت: این قابلیت ها با همكاری شركت های فناور و استارتاپ ها بوده است.



مریم طایفه محمودی در گفت وگو با ایسنا راه اندازی جویشگرهای بومی را یكی از موضوعات محوری این پژوهشكده دانست و اضافه كرد: "پارسی جو" و "یوز" دو تا از جویشگرهای بومی هستند كه تحت حمایت پژوهشگاه و با همكاری دو دانشگاه، راه اندازی و با همكاری بعضی از شركت ها به قابلیت های این موتورهای جستجوگر اضافه شده است.

وی اضافه شدن بخش ترجمه به این موتورها را همچون قابلیت های جدید این موتور دانست و تصریح كرد: به منظور تصحیح فرآیند جستجو، بعضی از شركت های فناوری كه در حوزه نقشه فعال بودند، با پارسی جو در این زمینه همكاری كردند.

محمودی با اشاره به اینكه جویشگر پارسی جو یك موتور جستجوی فارسی زبان است، اظهار نمود: به منظور توسعه كاربردهای این موتور جستجو قابلیت ترجمه هم به آن افزوده شد. این قابلیت سبب شده است تا كاربران به اطلاعات دیگری دسترسی داشته باشند.

معاون پژوهشكده IT پژوهشگاه ارتباطات و فناوری اطلاعات با اشاره به اهمیت راه اندازی موتور جستجوی فارسی، توضیح داد: هم اكنون جویشگرهای زیادی مانند گوگل با قابلیت های زیاد وجود دارند و كمتر كاربران به سمت جویشگرهای فارسی زبان می روند، ولی از آنجایی كه خیلی از محتواها و مستنداتی كه در سطح دانشگاه ها و سازمان ها و یا در سطح كشور وجود دارد كه به دلایل فرهنگی و اجتماعی و امنیتی امكان جستجو و بازیابی اطلاعات آنها با استفاده از جویشگرهای موجود فراهم نیست، از این رو پیاده سازی جویشگرهای بومی ضروری بود.

طایفه محمودی، "كلان داده ها" (Big Data) را از دیگر پروژه های این پژوهشكده نام برد و خاطرنشان كرد: از آنجایی كه روز به روز به طور گسترده داده ها افزایش می یابند لازم است این داده ها مورد تحلیل و ارزیابی قرار گیرد تا داده های مورد نیاز استخراج شود و در اختیار كاربران قرار گیرد كه در این راستا طرح "كلان داده ها" می تواند موثر باشد.

وی با اشاره به اینكه داده های موجود در این بخش شامل داده های متنی، صوتی، تصویری و ویدئویی است، افزود: این داده ها قابل استفاده برای همه سازمان ها و مراكز است؛ چون كه خیلی از این نهادها دارای داده های وسیعی هستند و تحلیل این داده ها می تواند قابل كاربرد برای این نهادها باشد.

محمودی در عین حال با تاكید بر اینكه ذخیره سازی این داده های كلان در یك مركز امروزه منتفی شده است، افزود: از آنجایی كه داده های هر دستگاه و نهادی بسیار زیاد است و از جانب دیگر تلاش می گردد تا این داده های وسیع به بسترهای "ابری" و "مه" بارگذاری شود تا امكان دسترسی از هر مكانی و در هر زمانی فراهم باشد، از این رو راه اندازی كلان داده در هر سازمانی به صورت جداگانه صورت می گیرد.

این محقق حوزه فناوری اطلاعات، "اینترنت اشیا" (IOT) را از دیگر موضوعات مطالعاتی این پژوهشكده نام برد و اظهار داشت: با عنایت به توسعه كاربردهای این فناوری در كشور، با تعامل با شركت ها و استارتاپ ها نسبت به تدوین نقشه راه اینترنت اشیا اقدام كردیم. ضمن آنكه آزمایشگاه های آن هم در حال راه اندازی است.

وی بیشترین كاربرد این فناوری را در مصرف انرژی دانست.

به گزارش دانلود فایل به نقل از ایسنا، نسخه سازمانی موتور جستجوگر پارسی جو، می تواند میلیاردها سند با قالب های مختلف را خزش (Crawl) و بعد از ذخیره سازی و نمایه سازی (Indexing) بر بستر توزیع شده در كمتر از یك ثانیه در آنها عملیات جستجو به زبان فارسی را انجام دهد.

سرویس جستجوی پارسی جو متناسب با نیاز سازمان ها و به صورت سفارشی هم به عرضه خدمات می پردازد. با عنایت به وجود اطلاعات متنوع در یك سازمان، سرویس مذكور هم راهكارهای یكپارچه برای پاسخگویی به نیازهای موجود عرضه می دهد.

پوشش بیشتر از ۱۰ میلیارد سند وب (متن، تصویر، ویدئو و صوت)، مدیریت گراف وب با بیشتر از ۴۰۰ میلیارد یال، جستجوی همزمان روی داده با قالب های مختلف ورودی، ذخیره سازی ده ها میلیارد سند روی بستر Hadoop/HBase، پردازش و استخراج هوشمند اطلاعات و دانش از اسناد فارسی، جستجوی سریع در كم تر از یك ثانیه در مقیاس بزرگ و حجم زیاد داده (میلیاردها سند)، اتصال به واحد پردازشگر زبان (درك و گسترش پرس وجو، خطایابی) و جستجوی پیشرفته با فیلترهای مختلف زمان، نوع داده و مكان از قابلیت های این موتور جستجو است.
پارسی جو همینطور قابلیت بازیابی نتایج بر مبنای پردازش های پیشرفته و هوشمند، دسته بندی اسناد با استفاده از روش های مدرن، تركیب جستجو روی اسناد داخلی و وب، عرضه نتایج متناسب با نیاز كاربران و عرضه API سفارشی را دارد.
اخبار، آب وهوا، اوقات شرعی، تصاویر، آوا، ترجمه و نقشه همچون خدمات این جویشگر فارسی است.
سامانه پردازش كلان داده (سامپاد) هم خدمات ذخیره سازی، مدل سازی و پردازش اطلاعات روی داده های حجیم را عرضه می دهد. این سامانه با فرمت های مختلف ورودی سازگار است، جستجو و پردازش اطلاعات را انجام می دهد، الگوها و آنومالی ها را كشف و دانش مورد نیاز را استخراج می كند.
این سامانه قابلیت سازگاری با ورودی های ساختار یافته/نیافته، ذخیره سازی ده ها میلیارد داده با حجم چندین پتا بایت روی بستر Hadoop/Hbase، پردازش داده ها برای كشف آنومالی، خوشه بندی و دسته بندی روی بستر Spark، نمایه سازی سریع داده ها برای دسترسی سریع با استفاده از روش های نمایه سازی معكوس و پردازش های مربوط به گراف را دارد.
جستجوی همزمان روی داده ها با الگوهای مختلف ورودی، زبان پرس وجوی ساختار یافته، عرضه نتایج به شكل مناسب و خوانا با نمایش پویا و جستجوی تركیبی با فیلترهای گوناگون (زمان، قالب و مكان) از دیگر قابلیت های این سامانه به حساب می آید.



1397/10/19
14:34:38
5.0 / 5
4093
تگهای خبر: ارتباطات , اینترنت , پروژه , خدمات
این مطلب را می پسندید؟
(1)
(0)

تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب
لطفا شما هم نظر دهید
= ۴ بعلاوه ۳
IT File دانلود فایل
itfile.ir - حقوق مادی و معنوی سایت دانلود فایل محفوظ است

دانلود فایل

دانلود و اشتراک گذاری فایل