Читаем
Пернетақтада орналастырудың статистик. негіздері
18 марта, 8:34Әліпби ауыстыруда маңызды мәселелердің бірі – әріптерді пернетақтада орналастыру. Адамның әріптерді пернетақтаның қай бұрышына орналастырса да, жаттанды түрде үйреніп алуы заңды. Алайда пернетақтада мәтін теруде әріптерді оңтайлы орналастыру адамның күш-қуатын және теруге кететін уақытты үнемдейді.
Сондықтан ұлттық әліпбидегі әріптерді пернетақтада тиімді орналастыруда лингвистикалық, әлеуметтік зерттеулер жүргізу қажет. Лингвистикалық зерттеулер жүргізу негізінен тіл білімінің қолданбалы бағытының зерттеу нысаны. Бұл ретте әріптерді пернетақтада орналастыруда қандай ұстанымдарға сүйенеміз деген мәселенің басын ашып алу қажет.
Әріптерді пернетақтада тиімді орналастыру мәселесіне қатысты А.Байтұрсынұлы атындағы Тіл білімі институты Қолданбалы лингвистика бөлімі қолданыстағы әріптердің кездесу жиілігін анықтады. Бұл жиілік талдау Білім және ғылым министрлігі тапсырысымен жарық көрген «Жалпы білім берудегі қазақ тілінің жиілік сөздігіне» негіз болған «Қазақ тілінің сөзформалар сөздігінің» мәтіні бойынша жасалды. Бұл сөздікте қазақ тілінің 5 стилінен 7 миллионнан астам сөзқолданыстан тұратын мәтіндер қамтылды. Төменде осы 7 миллионнан астам сөзқолданыстан алынған қазақ әріптерінің жиілік сөздігі берілді.
1-кесте. Қазақ тіліндегі әріптердің жиілікті-әліпбилік жиілік сөздігі
№ |
Әріп |
Абсолюттіжиілігі |
Бір топ әріптің мәтінді қамту пайызы |
№ |
Әріп |
Абсолютті жиілігі |
Бір топ әріптің мәтінді қамту пайызы |
1 |
2 |
3 |
4 |
1 |
2 |
3 |
4 |
1 |
А |
8630862 |
12,796 |
22 |
г |
903479 |
91,763 |
2 |
Е |
5660025 |
21,187 |
23 |
ң |
872812 |
93,057 |
3 |
Ы |
5378832 |
29,161 |
24 |
и |
866761 |
94,342 |
4 |
Н |
4192570 |
35,377 |
25 |
ж |
738252 |
95,437 |
5 |
І |
4154893 |
41,537 |
26 |
ұ |
673484 |
96,435 |
6 |
Т |
4066134 |
47,565 |
27 |
ө |
655787 |
97,408 |
7 |
Р |
4028709 |
53,537 |
28 |
ү |
598755 |
98,295 |
8 |
Л |
3824239 |
59,207 |
29 |
ә |
524073 |
99,072 |
9 |
Д |
3413312 |
64,267 |
30 |
я |
231433 |
99,415 |
10 |
С |
2708334 |
68,283 |
31 |
х |
105688 |
99,572 |
11 |
М |
2040371 |
71,308 |
32 |
ц |
81165 |
99,692 |
12 |
Қ |
1876617 |
74,090 |
33 |
ф |
58378 |
99,779 |
13 |
О |
1639224 |
76,520 |
34 |
в |
55978 |
99,862 |
14 |
К |
1633360 |
78,941 |
35 |
э |
30250 |
99,907 |
15 |
Ғ |
1256146 |
80,804 |
36 |
ь |
25076 |
99,944 |
16 |
Б |
1229938 |
82,627 |
37 |
ю |
20877 |
99,975 |
17 |
Й |
1175543 |
84,370 |
38 |
һ |
5406 |
99,983 |
18 |
У |
1103283 |
86,006 |
39 |
ъ |
5148 |
99,991 |
19 |
З |
1095869 |
87,630 |
40 |
ч |
3702 |
99,996 |
20 |
П |
978676 |
89,081 |
41 |
щ |
1679 |
99,998 |
21 |
Ш |
905698 |
90,424 |
42 |
ё |
1018 |
100 |
Ұлттық пернетақта жасауда жеке әріп жиілігі ғана емес, саусақпен оңай әрі тез басу үшін әріптердің тіркесімінің де жиілік сөздіктерін ескеру қажет. Яғни қай әріп қай әріппен жиі тіркесіп қолданылады деген мәселе маңызды. Осы проблеманы шешу үшін қазақ тілінің жоғарыда аталған 7 миллионнан астам сөзқолданыстан тұратын қазақ тілінің мәтіндерінен құрастырылған «Қазақ тілінің сөзформалар жиілік сөздігінен», осы сөздіктің статистикалық деректерін пайдалана отырып, қазақ әріптерінің екіәріптік тіркестерінің жиілік сөздігін құрастырдық.
2-кесте. Қазақ тілінің екіәріптік тіркестерінің жиілік сөздігінен үзінді:
Рет саны № |
Әріп тіркесі |
Абсолютті жиілік |
Бір топ әріп тіркестерінің мәтінді қамту пайызы
|
|
Рет саны № |
Әріп тіркесі |
Абсолютті жиілік |
Бір топ әріп тіркестерінің мәтінді қамту пайызы
|
1 |
2 |
3 |
4 |
|
1 |
2 |
3 |
4 |
1 |
ар |
688045 |
2,035495 |
|
44 |
ма |
229464 |
46,495744 |
2 |
ан |
582201 |
3,757865 |
|
45 |
са |
226934 |
47,167100 |
3 |
ал |
565089 |
5,429610 |
|
46 |
ге |
226772 |
47,837976 |
4 |
ын |
562671 |
7,094202 |
|
47 |
ел |
209952 |
48,459093 |
5 |
да |
560939 |
8,753670 |
|
48 |
ек |
208945 |
49,077231 |
6 |
та |
511161 |
10,265877 |
|
49 |
ғы |
207327 |
49,690582 |
7 |
ен |
501533 |
11,749600 |
|
50 |
лд |
198170 |
50,276843 |
8 |
ер |
481450 |
13,173909 |
|
51 |
ыр |
197109 |
50,859966 |
9 |
қа |
460416 |
14,535993 |
|
52 |
ағ |
196589 |
51,441550 |
10 |
де |
458037 |
15,891038 |
|
53 |
рд |
195039 |
52,018548 |
11 |
ін |
451434 |
17,226550 |
|
54 |
ес |
189725 |
52,579826 |
12 |
ла |
422562 |
18,476647 |
|
55 |
іл |
189148 |
53,139397 |
13 |
ды |
417831 |
19,712748 |
|
56 |
тт |
184683 |
53,685759 |
14 |
ты |
404750 |
20,910150 |
|
57 |
бі |
184178 |
54,230626 |
15 |
нд |
399330 |
22,091518 |
|
58 |
ің |
181594 |
54,767850 |
16 |
ға |
396123 |
23,263399 |
|
59 |
лі |
181226 |
55,303984 |
17 |
ке |
371958 |
24,363790 |
|
60 |
гі |
178293 |
55,831442 |
18 |
ай |
369359 |
25,456493 |
|
61 |
ау |
177800 |
56,357441 |
19 |
лы |
342672 |
26,470245 |
|
62 |
қы |
172081 |
56,866521 |
20 |
ті |
333046 |
27,455520 |
|
63 |
ре |
169334 |
57,367475 |
21 |
ді |
331481 |
28,436166 |
|
64 |
ыс |
168863 |
57,867035 |
22 |
ас |
330440 |
29,413731 |
|
65 |
сі |
168801 |
58,366412 |
23 |
сы |
327308 |
30,382031 |
|
66 |
ып |
166290 |
58,858360 |
24 |
ме |
323281 |
31,338418 |
|
67 |
ні |
163289 |
59,341430 |
25 |
ат |
284740 |
32,180786 |
|
68 |
ам |
161755 |
59,819962 |
26 |
ба |
281240 |
33,012799 |
|
69 |
ік |
154050 |
60,275700 |
27 |
ны |
276945 |
33,832107 |
|
70 |
ым |
147729 |
60,712738 |
28 |
ың |
275833 |
34,648124 |
|
71 |
ім |
147386 |
61,148761 |
29 |
ол |
273816 |
35,458175 |
|
72 |
бо |
146149 |
61,581124 |
30 |
те |
273269 |
36,266607 |
|
73 |
қт |
144973 |
62,010009 |
31 |
ет |
272744 |
37,073486 |
|
74 |
ад |
144878 |
62,438613 |
32 |
ры |
263800 |
37,853906 |
|
75 |
бе |
143874 |
62,864246 |
33 |
ық |
261904 |
38,628716 |
|
76 |
шы |
140779 |
63,280723 |
34 |
ра |
257203 |
39,389619 |
|
77 |
се |
137879 |
63,688621 |
35 |
на |
250705 |
40,131299 |
|
78 |
ем |
133338 |
64,083085 |
36 |
жа |
248531 |
40,866547 |
|
79 |
із |
131926 |
64,473371 |
37 |
ақ |
243641 |
41,587328 |
|
80 |
кі |
130520 |
64,859499 |
38 |
ыл |
241848 |
42,302805 |
|
81 |
ег |
128229 |
65,238848 |
39 |
ле |
241186 |
43,016324 |
|
82 |
кө |
127963 |
65,617411 |
40 |
не |
239816 |
43,725790 |
|
83 |
ор |
126556 |
65,991811 |
41 |
ст |
239516 |
44,434368 |
|
84 |
ап |
120653 |
66,348748 |
42 |
ір |
237178 |
45,136030 |
|
85 |
мы |
120124 |
66,704120 |
43 |
рі |
230151 |
45,816903 |
|
86 |
ыз |
119848 |
67,058675 |
Әріптерді пернетақтада орналастыруда әріп жиілігінен басқа, олардың қасындағы келесі әріппен тіркесуін де негізге алу пернетақта батырмасын басудың тиімділігі үшін қажет болғандықтан, олардың оң жақтарында жоғарыда үзінді келтірілген екіәріптік тіркестер жиілік сөздіктерінен алынған деректер мәліметіне сүйенген жөн болады.
Қазақ тілінің ұлттық компьютерлік пернетақтасында жиі кездесетін 19 әріп екі бөлікке бөлініп, пернетақтаның ортаңғы бөлігіне орналасады. Сол сияқты 2-кестедегі екіәріптік тіркестердің ең жиі қолданылатын тіркестердің екінші әріптерін жиі кездесетін әріптерге тіркесуге пернетақтаның жақын аралығына, яғни сол қол мен оң қол саусақтарына сәйкестендіріп орналастыру қажет.
Осы жиілік талдау (әріп және әріп тіркесінің жиілік сөздіктері) нәтижесі бойынша қазақ әріптері мен әріп тіркестерінің жиі кездесуі ескеріліп орналастырылған пернетақтаның пилоттық жобасы ұсынылды.
Пернетақтада әрбір әріптің кирилдегі және латындағы баламалары келтірілді. Пернетақтаның ортаңғы бөлігінде жиілік сөздіктегі ең жиі қолданған әріптер орын алды, ал олардың оң жақтарында екіәріптік тіркестер жиілік сөздігінен алынған әріптер орналастырылды.
Пернетақтаның шеткі жақтарына сирек кездескен әріптер орналастырылды. Пернетақтада көрініс таппаған дыбыстар: ш, ч мынадай әріп тіркестерінің sh/ш, ch/ч әрбіреуінің пернетақтада бар болуынан, олар орын алмады.
1-сурет. Статистикалық негіздегі пернетақта
Әріптерді пернетақтада орналастыруда оның бетіндегі батырмалар орналастырылған қатардың басуға, яғни мәтін теруге ыңғайлылығына қарай актив және пассив аймақтарға бөлінеді. Пернетақтаның әріп теруге ыңғайлы жері ортаңғы аймақ, әсіресе кертік тұрған жердің айналасы, асты мен үсті болып табылады. Ал шеткі батырмалар пассив аймаққа жатады. Актив және пассив аймақтарды пернетақтаның горизанталь (көлденең) және вертикаль (тіке) бөліктері бойынша да көрсетуге болады. Көлденең меже бойынша актив аймақ – ол екі кертік тұрған ортаңғы қатар, яғни қазіргі кирилдегі Ф әрпінен басталып, Э әрпіне аяталатын қатар. Одан кейінгі актив аймақ осы қатардың үстінде орналасқан үстіңгі қатар. Ал астыңғы қатар көбінесе сиректеу кездесетін әріптер орналасатын аймақ.
Батырмалардың тік бағыттағы (вертикалды) межесі кертік тұрған батырмалардың жаны, яғни ортаңғы, екінші қатардың жаны, ортаңғы тұсы. Сонымен қатар үстіңгі қатардағы кертпенің үстіңгі ортаңғы бөліктері. Одан кейінгісі кертпенің астыңғы ортаңғы бөліктері.
Ал осы үш қатардың шеткі бөліктері пассив аймақ болып есептеліп, сирек кездесетін әріптер не тыныс белгілер орналастырылады.
Осы әріптер орналастырылған пернетақта пилоттық жоба ретінде ұсынылып, пернетақтада теруге арналған арнайы компьютерлік бағдарлама жасалды. Жиілік талдау бойынша орналастырылған латын әріптері бірнеше пернетақта батырмасына жапсырылып, бұл пернетақта нұсқасының мәтін теруге ыңғайлы, тиімділігі уақыт сыйымдылығы мен қуат сыйымдылығына қарай сынақтан өткізілуде.
Сонымен егер жиілік ұстанымын негізге алатын болсақ, ең жиі қолданатын қазақ әріптері пернетақтаның ортаңғы жағында орналасуы қажет. Олар екі топқа бөлініп, бірінші, сол жақ қол саусақтарына және екінші, оң жақ қол саусақтарына деп ажыратылуы қажет. Сонымен бірге, екіәріптік тіркестердің статистикасы бойынша тіркестің екінші әрпі, тіркестің бірінші әрпінің оң жағына жақын орналасуы қажет деп білеміз.
Асқар ЖҰБАНОВ, А.Байтұрсынұлы атындағы Тіл білімі институтының бас ғылыми қызметкері, филология ғылымдарының докторы, профессор
Айман ЖАҢАБЕКОВА, А.Байтұрсынұлы атындағы Тіл білімі институтының бас ғылыми қызметкері, филология ғылымдарының докторы
Алматы қаласы
Дереккөз: egemen.kz
другие статьи
-
Жігіттер тобының орындауындағы әндер
31 января, 9:54 -
Русско-казахский сборник фраз и словосочетаний
13 марта, 23:18 -
ӘУЕ КЕМЕЛЕРІНДЕ КЕЗДЕСЕТІН АҚАУЛАР
28 февраля, 8:44