שם הסטודנט
:
וגדי עתאמנה
מחלקת הלימוד
:
הנדסת תוכנה
שם המנחה
:
רון שמואלי
בסיס ניתונים סינתטי לזיהוי כתב
יד מחובר מקוון
/
לא מקוון
תערוכת
פרויקטי
גמר
2013 1
מבוא
בניית מסד נתונים המכיל
מאות אלפי מילים
מחוברות
בוריאציות
ועיצובים שונים בצורה
ידנית
למטרת זיהוי כתב
יד
הינה עבודה
מאוד קשה ויקרה
.
בפרויקט זה אבצע אחד המאמרים של ד
"
ר סעאבנה ואלסנאא שמתאר מערכת יעילה
שמייצרת מסד נתונים סינטתי מקיף לזיהוי כתב
יד מחובר מקוון
/
לא מקוון בצורה אוטמטית
.
מסד נתונים זה ישמש חוקרים רבים העוסקים בזיהוי כתב
יד ערבי
.
מטרת הפרויקט
פיתוח מערכת שתייצר את בסיס הנתונים
המתואר בצורה סינתטית
,
כך שיכיל את כל תתי המילים
הקיימות בלקסיקון בכל
הוריאציות השונות
.
דרישות עיקריות
לאפשר
למשתמש להכניס את הקלט
)
את המופעים של האותיות
(
בצורה
. נוחה
לאפשר
למשתמש לבצע סגמנטציה של מסד הנתונים
ADAB
לאותיות ע
י "
המשתמשים
.
בניית
בסיס נתונים נוסף של אותיות
במופעים
השונים מתוך מסד הנתונים
ADAB
אשכול תתי המילים
)
CLUESTRING
.(
268...,163,164,165,166,167,168,169,170,171,172 152,153,154,155,156,157,158,159,160,161,...1