שם הסטודנט
:
וגדי עתאמנה
מחלקת הלימוד
:
הנדסת תוכנה
שם המנחה
:
רון שמואלי
בסיס ניתונים סינתטי לזיהוי כתב
יד מחובר מקוון
/
לא מקוון
תערוכת
פרויקטי
גמר
2013 1
•
מבוא
•
בניית מסד נתונים המכיל
מאות אלפי מילים
מחוברות
בוריאציות
ועיצובים שונים בצורה
ידנית
למטרת זיהוי כתב
יד
הינה עבודה
מאוד קשה ויקרה
.
בפרויקט זה אבצע אחד המאמרים של ד
"
ר סעאבנה ואלסנאא שמתאר מערכת יעילה
שמייצרת מסד נתונים סינטתי מקיף לזיהוי כתב
יד מחובר מקוון
/
לא מקוון בצורה אוטמטית
.
•
מסד נתונים זה ישמש חוקרים רבים העוסקים בזיהוי כתב
יד ערבי
.
•
מטרת הפרויקט
•
פיתוח מערכת שתייצר את בסיס הנתונים
המתואר בצורה סינתטית
,
כך שיכיל את כל תתי המילים
הקיימות בלקסיקון בכל
הוריאציות השונות
.
•
דרישות עיקריות
•
לאפשר
למשתמש להכניס את הקלט
)
את המופעים של האותיות
(
בצורה
. נוחה
•
לאפשר
למשתמש לבצע סגמנטציה של מסד הנתונים
ADAB
לאותיות ע
י "
המשתמשים
.
•
בניית
בסיס נתונים נוסף של אותיות
במופעים
השונים מתוך מסד הנתונים
ADAB
•
אשכול תתי המילים
)
CLUESTRING
.(