Лого на страниците (малко).

Заглавна страница > Четива > Четива за глотометрията > cream в режим „expert“ > Забава с панграми

 

Александър Иванов

cream в режим „expert“

Забава с панграми

Панграма (англ. pangram) е израз, съдържащ всички букви от азбуката. За филолога е ясно — това е съчинена дума със старогръцки морфеми (както много други научни термини), която поморфемно можем да преведем като „всичкобуквие“.

Панграмата е донякъде полезна, когато трябва да се види символното многообразие на някой шрифт. Затова в повечето програми, с които можем да разглеждаме шрифтове, ще видите и английската панграма The quick brown fox jumps over the lazy dog. В повечето такива програми този текст може да се смени — за нас е полезно да го сменим с българска панграма, например За миг бях в чужд плюшен скърцащ фотьойл. А в този блог има страница List of pangrams, на която има дълъг списък от такива изрази на най-различни езици.

Та като упражнение предлагам следното: представлява ли панграма английският израз That which does not destroy me, only makes me stronger?

Въпросът ми не е измислен — ако с програмата display от пакета imagemagic погледнете някой шрифт, ще видите този текст, та изниква подозрението дали не е панграма.

Ако не е панграма, кои са липсващите букви?

Насоки:

— копирайте реда в редактора два пъти и обработвайте второто копие с маркиране (във Visual Mode) — така оригиналът ще може да бъде пред очите ви;

— препишете реда с малки (или с главни) букви — разликата между главни и малки букви не ни интересува;

— премахнете шпациите и пунктуационните знакове — и те не ни интересуват;

— превърнете реда в списък от символи, подредете ги и направете фреквентен речник.

Опитайте да проверите чрез тази техника и изразите: The quick brown fox jumped over the lazy dog и За миг бях в чужд плюшен скърцащ фотьойл — панграми ли са наистина?

Ясно е, че аз ви подбутвам да правите с cream тези упражнения, за да привикнете с работата в него.

На практика вие може да си напишете азбуката в една колона на лист хартия и с вертикална чертичка да отбелязвате всяко срещане на дадена буква в обработвания израз. Ще получите дори нещо по-нагледно, нещо като хистограма на срещаните букви. Опитайте и това.

В предкомпютърната ера в статистиката бяха разработени много находчиви такива „ръчни“ (тоест, с лист хартия и молив) методи за предварителна обработка на данните, пък и за статистически пресмятания. Не е лошо глотометристът да ги познава. Те и днес в някои случаи дават най-бързо решение.

Предимствата обаче на компютърната обработка (чрез cream, например) е в бързината. Практически за едно и също време можем да направим фреквентен речник на буквите в израза За миг бях в чужд плюшен скърцащ фотьойл, но и изрази като текста на Библията, Илиада или Записките по българските въстания.

Значи, компютрите (чрез компютърните програми) неимоверно ускоряват работата с данните, но по никакъв начин не ни предпазват от глупостта, която ще направим ние. Тоест, мисленето и знанието не са отменени. Запомнете това!

Сега (след като имаме фреквентен речник на символите) можем да си съчиним един „критерий за успешност“ на панграмата. Очевидно най-успешна ще е панграма, която се състои от толкова символа, колкото има в азбуката. Тогава

<брой на буквите в панграмата> / <брой на буквите в азбуката>

може да бъде такъв критерий. Разбира се, няма да броим шпациите и пунктуационните знакове и няма да правим разлика между малки и главни букви. „Критерият“ може да взема стойности от 1 (най-успешната панграма) до n > 1 (n е рационално число, тоест съдържа цяла част и, евентуално, дробна). Няма горна граница за „критерия“ ни — „Под игото“ със сигурност ще се окаже панграма, но „критерият“ ще бъде много, много голям, тоест „Под игото“ ще се окаже една много, много лоша панграма. (Един бърз преглед показва, че „Под игото“ е наистина панграма, но „критерият“ е от порядъка на 19 000! Пак да повторя — изключително лош!)

Обърнете внимание, че нашият „критерий“ не зависи от броя на символите в азбуката (резултатът се „премерва“ спрямо броя на символите в азбуката), а това дава надежда, че можем с него да сравняваме панграми на различни езици (тоест, на азбуки с различен брой символи). Бърз експеримент за The quick brown fox jumps over the lazy dog показва 1,35, а за За миг бях в чужд плюшен скърцащ фотьойл — 1,10. Да! Българската панграма наистина изглежда по-успешна от английската по този „критерий“.

Но… Но сега е време да спрем и да помислим като филолози.

Нашият „критерий“ изобщо не отчита човешкия фактор — необходимостта да се запомни панграмата съвсем дословно. А наблюденията посочват, че дори актьорите — хора с професионално тренирана памет за текст — не помнят съвсем дословно текста…

От опит знам, че не мога да запомня „За миг бях…“, а съм чел, че и с кафявата лисица има такива проблеми — бъркат я хората.

Очевидно е, че една напълно „успешна“ панграма с оценка 1 ще бъде един доста изкуствен израз, който трудно ще се помни. В същото време една много „неуспешна“ панграма, например с оценка 3 или 4, или повече вече става твърде дълга и също ще се помни трудно. Така възниква въпросът — съществува ли някаква „оптимална“ стойност за критерия, при който изразите панграми да се помнят най-добре?

Ха! Уж започнахме на шега, а се натъкнахме на тема за психолингвистично изследване. Ама то е така — като работите с материал, па дори и от няколко израза панграми, темите за изследвания идват сами — материалът ви ги „разказва“.

По-нататък може да продължите и без мене.

Разкарайте панграмите. Помислете каква измерителна единица за дължина на текста да използвате, за да може да съпоставяте изрази от различни стилове и от различни езици. А въпросите ще дойдат сами:

— дали стихотворната реч се запомня по-добре от прозаичната?

— ако е така, кой фактор е по-важен за запомнянето — метриката или римата?

— кой тип прозаичен текст се запомня по-добре — монолог или диалог? С повече глаголи? С повече имена?

— в монолога кой текст се запомня по-добре — разказ или описание/разсъждение?

— има ли разлика в запомнянето на текст между мъжете и жените?

— а по възраст — между деца, младежи, хора в зряла възраст, старци?

— как се отнасят навиците за четене към запомнянето на текст?

— способностите за запомняне на текст зависят ли от родния език?

— а от знанието на чужди езици?

— вярно ли е, че северните народи имат по-добра памет за текст от южните?…

Хе-хе! Май животът няма да ви стигне за всичко това.

Само че сега съм длъжен да ви предупредя. Не случайно поставям в кавички „критерия за успешност“ на панграмата — той има тежки кусури. Например, едно повторение на символ (честота 2) в азбука от 26 букви ще има по-голяма „тежест“ (2 / 26 = 0,077), отколкото в азбука от 30 букви (2 / 30 = 0,067). А то май се отнася и за „тежестта“ на единичната буква в азбука от 26, 30 или 32 букви. Така че не използвайте този „критерий“ в реални изследвания. Математически грамотните хора ще ви критикуват. И с право.

И сега е моментът, в който трябва да съобразите, че май количествената култура е нужна.

Страница: А. И.
Електронна поща
Дата на публикуване: 15.V.2014
Последна редакция: 27.IV.2023
Съобразено с
html5/css3