עמוד 9:
הרעיון שעומד מאחורי פרק זה הוא שהשימוש בתדירות ובטווח התרחשות עוזר כדי להבחין בין כמה רמות של אוצר מילים.
ההבחנה בין רמות אלה מסייעת להבטיח שהלומדים ילמדו אוצר מילים ברצף השימושי ביותר ויפיקו תועלת מרבית מאוצר המילים שהם לומדים. ההבחנה בין תדירות גבוהה/ תדירות בינונית / תדירות נמוכה מבטיחה את התמודדות המורה עם אוצר מילים בדרכים היעילות ביותר.
מניית מילים
יש כמה דרכים למנות מילים, כלומר – לקבוע מה יש למנות.
תַּמְנִית
דרך אחת היא פשוט לספור כל מופע של מילה (בכל צורת נטייה שהיא) בטקסט שמדובר בעל פה, או בטקסט כתוב. אם אותה מילה מופיעה יותר מפעם אחת, יש לספור כל היקרות של המילה. כך למשל, המשפט “אין זה קל לומר זאת נכון” יכיל שש מילים, למרות ששתיים מהמילים הן צורת נטייה של אותה מילה: “זה”. למילים שנספרות כך קוראים “תמנית” ולפעמים גם
running words”” (אין לזה תרגום מקצועי לעברית, אפשר לקרוא לזה “רצף מילים“).
כדי להשיב על שאלות כמו: “כמה מילים יש בעמוד או בטור?”, “מה אורך הספר הזה?”, או “כמה מילים בדקה אומר האדם הממוצע?”, שיטת המנייה שלנו תהיה התמנית.
סוגים
אנחנו יכולים למנות את המילים במשפט “אין זה קל לומר זאת נכון” בדרך אחרת. כאשר אותה המילה מופיעה שוב, אין אנו מונים אותה. כך שהמשפט שמורכב משש תמניות, מכיל חמישה סוגים שונים של מילים. כך נמנה מילים כאשר נרצה להשיב לשאלות כמו: “כמה רחב היה אוצר המילים של שייקספיר?”, או (שורה עליונה מעמוד עשר חתוכה) “כמה מילים יש במילון הזה?”
עמוד 10:
לֶמות
למנות ספר וספרים כשתי מילים שונות שיש ללמוד – נראה מעט משונה. לכן, במקום למנות סוגים שונים כמילים שונות, מילים קשורות/מקורבות יוכלו להיחשב כנציגות של אותה מילה: לֶמה (תבנית של מילה שניתן להטות אותה בהטיות דקדוקיות שונות).
הלמה מורכבת ממילה ראשית ומההטיות הדקדוקיות השונות שלה. לרוב כל הפריטים הכלולים בלמה נמצאים באותם חלקים של הדיבור. הדקדוק האנגלי מורכב מלשון רבים, מגוף שלישי – יחיד בזמן הווה, מזמן עבר, מצורת פועל אשר מופיעה לאחר פועל העזר “have” בהווה מושלם וכצורת הסביל (אחרי be), ING, דקדוק השוואתי, סופרלטיב, כינויי שייכות.
בחישוב התדירות של ת’ורנדייק ולורג’ (1944) הבסיס למניין היה למות, ומניין ממוחשב של קורפוס בראון העלה רשימה למתית. לפי המניין של בראון הצורות ההשוואתיות והסופרלטיביות של המילה לא נכללו בתוך המלה, וצורה זהה ששימשה חלקי דיבור שונים (הליכה כפועל והליכה כשם עצם) לא נמנתה כחלק מאותה למה. צורות איות שונות לאותן מילים (favor, favour) לרוב נכללות כחלק של אותה למה כאשר הן באותו חלק של דיבור. ליץ’ ושות’ (2001) השתמשו באותו קריטריון כאשר מנו את הקורפוס הבריטי הלאומי.
מאחורי הרעיון להשתמש בלמות כיחידת מניין עומד עיקרון “עומס הלמידה/נטל הלמידה”. עומס הלמידה של פריט מסוים הוא המאמץ הנדרש כדי ללמוד אותו. כאשר הלומדים יכולים להשתמש בשיטת ההטיות הדקדוקיות, נטל הלמידה על המילה “משתפר” ( (mendsהיה זניח אם הלומד כבר מכיר “שיפור” (mend). אחת הבעיות הצפויות ביצירת למות היא להחליט כיצד לנהוג עם צורות לא רגילות כמו “mice” (עכברים) brought(הביא), beaten(מוכה) ו- best(הטוב ביותר), עומס הלמידה במילים אלה הוא כבד יותר מהעומס בצורות רגילות כמו: ספרים (books), רץ (runs), דיבר (talked), רחץ/התרחץ (washed), הכי מהר (fastest).
האם יש למנות את הצורות הלא רגילות כחלק של אותה למה כמילת בסיס, או שמא יש למנות אותן כמו שמשתמשים בשמות תואר או בשמות עצם במילים כמו מקור/מקורי (original), ובשמות עצם ושמות פועל כמו במילה הציג/תצוגה display)). עוד בעיה עם למות היא להחליט מה המילה הראשית של הלמה – הבסיס.
כאשר משתמשים בלמה כיחידת מניין, הדבר מפחית את מספר היחידות בקורפוס מסוים. באואר ונאישון (1993) חישבו ומצאו כי 61,805 סוגים מתויגים (או 45,957 סוגים לא מתויגים) בקורפוס בראון מצטמצמים ל – 37,617 למות.
(לא ניתן לקרוא 2 שורות אחרונות בעמוד)
עמוד 11:
משפחות מילים
הלמות הן שלב בכיוון הנכון כאשר מנסים לייצג את עומס הלמידה באמצעות מניין המילים. עם זאת, יש נספחים שונים שמשתמשים בהם בשיטתיות ומפחיתים מאוד את עומס הלמידה של מילים שאובות המכילות צורות בסיסיות ידועות, למשל ly, ness, un. משפחת מילים מורכבת ממילה ראשית, מהצורות הנטויות שלה ומצורות שאובות מקורבות.
הבעיה העיקרית במניין אשר משתמש במשפחות מילים היא להחליט אילו מילים נכללות במשפחת המילים ואילו מילים לא. היכרות הלומדים עם התחיליות והסופיות מתפתחת ככל שהם מתנסים יותר בשפה. משפחת מילים סבירה ללומד אחד, עשויה להיות מעבר לרמת המיומנות הנוכחית של לומד אחר. המשמעות היא שבדרך כלל צריך לקבוע רמה של משפחות מילים, ולהתחיל בייצוגים הבסיסיים ביותר והברורים ביותר ומשם להתקדם לאפשרויות פחות ברורות מאליהן. ורד וצ’ואנג’ונדאנג (2009) מתריעים כי עלינו להיות זהירים ולא להניח שהלומדים מכירים את נציגי משפחות המילים. מחקרם בקרב סטודנטים ברמת מיומנות נמוכה באוניברסיטה בתאילנד, הראה כי יכולת הסטודנטים לזהות קירבה בין גזעים וצורות שאובות הייתה מוגבלת מאוד. ניובאכר וקלאסהן (2009) מצאו כי דוברי גרמנית שאינם ילידים ומיומנותם נמוכה, הושפעו מהמבנה המורפולוגי המערב מוספיות רגילות יותר מאשר דוברי גרמנית לא ילידיים בעלי מיומנות גבוהה. נראה כי הדוברים הלא ילידיים נטו לאחסן מילים כמכלולים בלתי מנותחים.
באיזו יחידת מניין אנו משתמשים כאשר המניין יהיה תלוי בסיבה שבגללה אנחנו מונים? בכל יחידה שנבחר להשתמש, עלינו להבטיח שהיא המתאימה ביותר למטרותינו. עליו להחליט זאת כאשר אנו מחליטים כמה אוצר מילים הלומדים צריכים לדעת.
כמה אוצר מילים על הלומדים לדעת?
אם אנו בונים קורס שפה, או מתכננים את סדר הלימודים שלנו, יעזור להיות מסוגלים לקבוע את מטרות הלמידה כך שנוכל להשתמש בשפה בדרכים הרצויות לנו. כאשר אנו מתכננים את יעדי אוצר המילים בתהליך למידה ארוך טווח, אנו יכולים להביט בשלושה סוגים של מידע שיעזור להחליט כמה אוצר מילים יש ללמוד: מספר המילים בשפה, מספר המילים הידועות לדוברים ילידי המקום ומספר המילים שצריך כדי להשתמש בשפה.
עמוד 12:
כמה מילים יש בשפה?
המטרה השאפתנית ביותר היא לדעת את כל השפה. זוהי מטרה שאפתנית משום שגם דוברי השפה ילידי המקום אינם יודעים את כל אוצר המילים של השפה. יש הרבה אוצרות מילים ייחודיים כמו אוצר מילים בפיזיקה גרעינית או במחשבים, הידועים לקבוצות בודדות של אנשים המתמחים בתחומים האלה. ובכל זאת יהיה זה מעניין לדעת כמה מילים יש בשפה. אין לכך תשובה קלה משום שיש הרבה שאלות אחרות המשפיעות על התשובה, והן לוקחות בחשבון את הדברים הבאים:
מה אנו מחשיבים כמילה? האם אנו מחשיבים book ו books כאותה מילה? האם אנו מחשיבים green (צבע) ו – green (אחו) כאותה מילה? האם אנו מונים שמות של אנשים? האם אנו מחשיבים שמות של מוצרים כמו “פפסי” או “שברולט”? דרך אחת להשיב על השאלות האלה ועל השאלה הגדולה “כמה מילים יש באנגלית?” היא למנות את מספר המילים במילונים גדולים מאוד. מילון ובסטר הוא אחד המילונים הלא היסטוריים הגדולים ביותר בשפה האנגלית. יש בתוכו כ – 54,000 משפחות של מילות בסיס, להוציא שמות עצם פרטיים (גואולדן ושות’, 1990). זה מספר גדול מאוד והוא הרבה מעבר למטרותיהם של לומדי השפה כשפה ראשונה וכשפה שניה. דרך אחרת היא לבחון אוספים גדולים של טקסטים ולראות כמה מילים מופיעות בטקסטים האלה. נאג’י ואנדרסון (1984) ניתחו חלק מהמידע בספר תדירות המילים של קרול ושות’ (1971) ומצאו כי בהפחתת שמות עצם פרטיים, מילים זרות, נוסחות, מספרים ו”לא מילים”, היו בין 54,000 – 88,500 משפחות מילים באנגלית מודפסת לבתי ספר, תלוי מה נכלל במשפחת מילים. ספר תדירות המילים מבוסס על קורפוס של חמישה מיליון תמניות. ניתוח בשיטת הטווחים של הקורפוס הלאומי הבריטי העלה תוצאות דומות.
יש 272,782 סוגי מילים בקורפוס הבריטי שאינם ב – 20,000 משפחות המילים הראשונות ובנלוות: שמות עצם פרטיים, מילות שוליים, צירופי מילים וקיצורים. כמעט מחצית מתוך 272,782 משפחות מילים שונות הן שמות עצם פרטיים. ארבעה אחוזים הם מילים זרות ושישה אחוזים הם נציגים בתדירות נמוכה של משפחות מילים שכבר נמצאות ברשימות של אלפי מילים. באופן אידיאלי חברי המשפחות האלה צריכים להתווסף למשפחות המילים ברשימות הקיימות.
המילים החדשות עדיין לא נמצאות ברשימות, וגם 20000 ברשימות המילים מסתכמות בערך ל – 70,000 משפחות מילים אשר… (סוף המשפט נסרק לא טוב ואי אפשר לתרגם).
עמוד 13:
ההערכות של אנדרסון (1984) ומספר המילים במילונים לא היסטוריים בגודל סביר.
סיבה מרכזית לניסיון לבדוק כמה מילים יש באנגלית היא כדי לקבוע גבולות לגודל אוצר המילים של הלומדים. מחקרים מוקדמים שנעשו בשיטה לקויה בדבר גודל אוצר מילים הגיעו למימדים שהם מעבר למספר המילים שיש בשפה.
כמה מילים דוברי שפה ילידיים יודעים?
במקום לברר כמה מילים יש בשפה, דרך שאפתנית פחות לקביעת יעדי לימוד אוצר מילים היא לבדוק מה דוברי השפה ילידי המקום יודעים. לרוע המזל, לא הרבה מחקרים נעשו בנושא מדידת גודל אוצר המילים, והתוצאות המתחילות עוד בסוף המאה ה – 19 לרוב שגויות. נעסוק בסיבות לכך בפרק 13.
מחקרים אמינים אחרים (גואולדן ושות’, 1990; זכמאיסטר ושות’ 1995) גורסים כי דוברי אנגלית משכילים ילידי המקום מכירים פחות מ – 20000 משפחות מילים. ההערכות האלו די נמוכות מפני שיחידת המניין היא משפחות מילים אשר להן יש מספר חברי משפחה שנגזרים מהן, ושמות עצם פרטיים לא כלולים בספירה. ובהערכה גסה בשלבי החיים המוקדמים, החל בגיל 3 וכנראה שעד גיל 25 לערך, דוברים ילידי המקום יוסיפו בממוצע 1000 משפחות מילים לאוצר המילים שלהם בכל שנה (בימילר וסלונים, 2001). למידה של 1000 משפחות מילים בשנה, היא יעד שאפתני עבור דוברי אנגלית שאינם ילידי המקום, במיוחד עבור כאלה שלומדים אנגלית כשפה זרה ולא כשפה שנייה. לעומת זאת חשוב לציין כי עומס הלמידה של מילים באנגלית נעשה קל יותר עבור הלומדים, וזאת משום שהרבה מילים באנגלית קיימות כמילים שאולות בשפת האם של הלומד. לדוגמא דאולטון (2008) מעריך כי קרוב למחצית 3000 המילים הראשונות בשפה האנגלית קיימות בשפה היפנית באיזושהי צורה, והלומדים היפניים מכירים את משמעות המילים השאולות האלו. קיומן של המילים השאולות מקל על למידת הצורות באנגלית.
עלינו להיזהר כאשר אנו קובעים ללומדי שפה שניה יעדי למידה המבוססים על מיומנות של דוברי השפה ילידי המקום. מאלדר והלסטיג’ן (2011) בחנו את מיומנות השפה ההולנדית בקרב דוברי השפה ילידי הולנד. הם דגמו דוברים ילידי המקום בגילי 18 – 76, מטווח רחב של רמות השכלה, וממקצועות מגוונים. שטף הדיבור וטווח הזיכרון הלקסיקלי פחתו ככל… (המשפט נקטע באמצע)
(סוף עמוד 13 אין עמודים 14,15)
עמוד 16:
טבלה 1.2: גודל אוצר המילים באנגלית הנדרש כדי לכסות 95% ו 98% (כולל שמות עצם פרטיים) ממגוון הטקסטים (נאישון, 2006)
טקסט | כיסוי של 95% | כיסוי של 98% | שמות עצם פרטיים |
רומנים | 4,000 משפחות מילים | 9,000 משפחות מילים | 1-2% |
עיתונים | 4,000 משפחות מילים | 8,000 משפחות מילים | 5-6% |
סרטי ילדים | 4,000 משפחות מילים | 6,000 משפחות מילים | 1.5% |
אנגלית מדוברת | 3,000 משפחות מילים | 7,000 משפחות מילים | 1.3% |
ווב ומקאליסטר (טרם ראה אור) מראים כי גודל אוצר המילים בטקסטים שנכתבו עבור דוברים צעירים ילדי המקום (כתבי העת של ניו זילנד לבית הספר – הפופולריים מאוד) זהה לגודל הנדרש בטקסטים שנכתבו עבור דוברים מבוגרים ילידי המקום. באופן צפוי, לקוראים מצטיינים יש הספק מבטיח יותר.
רשימות מילים מבוססות על תדירות
אנו יכולים להבחין בין 3 רמות של אוצר מילים המבוסס על תדירות. הבה נתבונן בטקסט אקדמי כתוב ונבחן את רמות התדירות השונות שיש בו.
הטקסט לקוח מ Forever and Forest שכתב נוויל פיט (1987).
אוצר המילים מתחלק לשלוש קבוצות בהתאם לרשימות תדירות של משפחות מילים. המילים בתדירות גבוהה (2,000 משפחות מילים התדירות ביותר) לא מסומנות בטקסט, המילים בתדירות בינונית (7,000 משפחות מילים מהמקומות ה – 3-9 ברשימות בנות 1000 מילים כוללות) מודגשות בכתב נטוי, והמילים בתדירות נמוכה (במקום העשירי ואילך ברשימות בנות 1000 מילים) בכתב מודגש.
עמוד 9:
הרעיון שעומד מאחורי פרק זה הוא שהשימוש בתדירות ובטווח התרחשות עוזר כדי להבחין בין כמה רמות של אוצר מילים.
ההבחנה בין רמות אלה מסייעת להבטיח שהלומדים ילמדו אוצר מילים ברצף השימושי ביותר ויפיקו תועלת מרבית מאוצר המילים שהם לומדים. ההבחנה בין תדירות גבוהה/ תדירות בינונית / תדירות נמוכה מבטיחה את התמודדות המורה עם אוצר מילים בדרכים היעילות ביותר.
מניית מילים
יש כמה דרכים למנות מילים, כלומר – לקבוע מה יש למנות.
תַּמְנִית
דרך אחת היא פשוט לספור כל מופע של מילה (בכל צורת נטייה שהיא) בטקסט שמדובר בעל פה, או בטקסט כתוב. אם אותה מילה מופיעה יותר מפעם אחת, יש לספור כל היקרות של המילה. כך למשל, המשפט "אין זה קל לומר זאת נכון" יכיל שש מילים, למרות ששתיים מהמילים הן צורת נטייה של אותה מילה: "זה". למילים שנספרות כך קוראים "תמנית" ולפעמים גם
running words"" (אין לזה תרגום מקצועי לעברית, אפשר לקרוא לזה "רצף מילים").
כדי להשיב על שאלות כמו: "כמה מילים יש בעמוד או בטור?", "מה אורך הספר הזה?", או "כמה מילים בדקה אומר האדם הממוצע?", שיטת המנייה שלנו תהיה התמנית.
סוגים
אנחנו יכולים למנות את המילים במשפט "אין זה קל לומר זאת נכון" בדרך אחרת. כאשר אותה המילה מופיעה שוב, אין אנו מונים אותה. כך שהמשפט שמורכב משש תמניות, מכיל חמישה סוגים שונים של מילים. כך נמנה מילים כאשר נרצה להשיב לשאלות כמו: "כמה רחב היה אוצר המילים של שייקספיר?", או (שורה עליונה מעמוד עשר חתוכה) "כמה מילים יש במילון הזה?"
עמוד 10:
לֶמות
למנות ספר וספרים כשתי מילים שונות שיש ללמוד – נראה מעט משונה. לכן, במקום למנות סוגים שונים כמילים שונות, מילים קשורות/מקורבות יוכלו להיחשב כנציגות של אותה מילה: לֶמה (תבנית של...
295.00 ₪
295.00 ₪