The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Атака Trojan Source для внедрения изменений в код, незаметных для разработчика, opennews (ok), 01-Ноя-21, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


175. "Атака Trojan Source для внедрения изменений в код, незаметны..."  +1 +/
Сообщение от keydon (ok), 03-Ноя-21, 02:10 
Что ж в этом правильного?
1) Что-то много стандартов кодировок. Надоело! Давайте сделаем одну, пускай и медленную, но со всем фаршем! А нет, что-то не идет. Давайте еще к ней еще наклепаем пару кодировок! Да! UTF-8. А давайте еще UTF-16! А еще UTF-32! А еще 2 вида BOM добавим! А еще кривую реализацию для винды! Больше кодировок юникода! Больше!
2) Давайте кодировать как можно компактнее? Не, бред какой-то лучше давайте каждый символ, даже очень похожий будет кодироваться по отдельности? Ну чтобы различать эти символы. Разработчики железа уже за нас заплатили, гулять так гулять. Минуточку, а почему сербская А КОДИРУЕТСЯ как русская А? А польское А это английское А? Ммм... логично? Не очень. Просто живи с этим. Но в большинстве других символов это не так. Мы сделаем тебе несколько одинаковых крестиков с разными кодировками.
3) А давайте запихнем в юникод знаки вымершей цивилизации, алхимические знаки, древнеегипетский или древнепермское письмо http://unicode.org/charts/PDF/Unicode-7.0/U70-10350.pdf! Ну и еще бесконечные эмодзи (эти хотя бы как-то используются, но имхо это довольно костыльно).
4) Так давайте добавим символы заставляющие текст писать справа налево (ха-ха, посмотрите на этих жалких разработчиков библиотек для нашей кодировки), но не добавим символов чтобы писать сверху вниз и снизу верх! Ок, все равно я никогда не любил китайцев.
5) Так, у нас столько всего есть, а где взять библиотеки чтобы это отобразить? Удачи, это не наше дело. Встретимся через пару-десятков лет когда научишься хотя бы тестировать юникод.
6) Подскажите шрифт для юникода? Для латиницы вот эти, для русского вот этот, вот этот для математических символов...
7) А помните мы решили для каждого символа сделать свою кодировку? Что-то пошло не так, хакеры выдают xn--ggle-55da.com (о русская) за google.com за google.com.
Ну и что мы имеем? Гору библиотек разной степени безопасности, кривизны, функционала и производительности, несколько видов самого протокола, множество проблем как при его использовании, так и при работе с ним, и все равно есть проблемы с локализацией условного канадского диалекта французского.

Итого семейство юникода худшее семейство кодировок:
Производительный: нет
Компактный: нет
Простой: нет
Безопасный для копирования: нет
Безопасный для приложения: нет
Решил проблему с языками: нет
Поддерживается шрифтами: нет
Специализирован: нет
Стал всемирным стандартом-горцем: нет
Можно добавить свой символ за мешок денег: да
Придется вам жить с этим: да

> Ты как маленький виноваты все, но не ты сам.

Я просто вижу очевидные проблемы и говорю о них. Немного грустно что пришли к такому !@#$%, но искать виноватых я не намерен. И уж тем более мне не понятно в чем моя вина. Вот если бы заткнулся и восхвалял очевидно проблемную кодировку, то тут можно было меня обвинить в апатии.

Ответить | Правка | Наверх | Cообщить модератору

177. "Атака Trojan Source для внедрения изменений в код, незаметны..."  +/
Сообщение от Аноним (177), 03-Ноя-21, 08:05 
>Что ж в этом правильного?

Юникод рационален, поэтому правилен.

>Что-то много стандартов кодировок. Надоело! Давайте сделаем одну, пускай и медленную, но со всем фаршем! А нет, что-то не идет. Давайте еще к ней еще наклепаем пару кодировок

Флуд. А если по делу, то UTF-8 придумали отцы юниксоиды специально для англоговорящих стран, в нём неиспользуемые, или же малоиспользуемые символы кириллицы кодируются дополняющимися битами. Китайцы выбрали UTF-16 и UTF-32 потому-что их иероглифы не помещаются в 8 бит.

>А еще 2 вида BOM добавим!

Ты ошибся адресом, Юникод тут не причём. Отправляй претензию программистам текстовых редакторов.

>А давайте запихнем в юникод знаки вымершей цивилизации, алхимические знаки, древнеегипетский или древнепермское письмо

Что предлагаешь? Исследователям и учёным вместо символов векторные картинки всталять, ты серъёзно?

>Так давайте добавим символы заставляющие текст писать справа налево

Арабский мир щемишь? Они же с лева направо пишут.

Ты видимо решил процитировать всю Википедию? Ешё раз тебе говорю, Юникод - дна из самых лучших вещей, которое сделало человечество.

Ответить | Правка | Наверх | Cообщить модератору

185. "Атака Trojan Source для внедрения изменений в код, незаметны..."  +/
Сообщение от keydon (ok), 03-Ноя-21, 13:17 
>>Что ж в этом правильного?
> Юникод рационален, поэтому правилен.

От того что вы называете его рациональным, рациональнее он не становится.

> Флуд. А если по делу, то UTF-8 придумали отцы юниксоиды специально для
> англоговорящих стран, в нём неиспользуемые, или же малоиспользуемые символы кириллицы
> кодируются дополняющимися битами. Китайцы выбрали UTF-16 и UTF-32 потому-что их иероглифы
> не помещаются в 8 бит.

И что это меняет? У нас есть 3 довольно сильно отличающихся кодировки и еще 4 вариации с различным BOM.

Как мы можем определить длину последовательности?
1) Зафиксировать длину (быстро, не расширяемо)
2) Обозначить динамически символом (зато все поместится)
Что делает юникод? Он для толстого UTF-32 ФИКСИРУЕТ длину кода, а для UTF-8 и UTF-16 НЕ ФИКСИРУЕТ длину кода. Так что и в микроконтроллеры не засунешь и гигабайты текста не сэкономишь на суперкомпьютере. И не быстрый (потому что диакритические знаки, парные символы, регистр превращает в другой символ, вот это все) и не ультимативно функциональный (потому что что-то недопихали) и не простой (потому что фарша гораздо больше чем может переварить большинство разработчиков).

Немного про нейминг:
UTF-8 с динамической длинной кодирования 8 бит (вообще-то больше, но потом его ограничили. зачем?)
UTF-16 с динамической длинной кодирования 16 бит
UTF-32 с фиксированной длинной кодирования в 32 бит. WHAT? Почему же он называется также как и UTF-8 и UTF-16? Я могу решить что он тоже с динамической длиной.

Также и с BOM напрашивается 2 стратегии:
1) всегда один и тот же BOM (хорошо для стандартизации и обмена)
2) для разных архитектур разный BOM (хорошо для производительности на некоторых архитектурах, плохо для всего остального)
Что делает Юникод для UTF-16 и UTF-32? Правильно не стандартизирует и не претендует на скорость. Т.е. худшее из двух миров.

Зачем вообще нужен UTF-32 если он и не быстрый и все алфавиты не покрывает, но включает много чего ненужного? Да никто не знает. Он просто есть.

>>А еще 2 вида BOM добавим!
> Ты ошибся адресом, Юникод тут не причём. Отправляй претензию программистам текстовых редакторов.

Не знаю повлияли ли как то на это текстовые редакторы, но виды BOM зафиксированы в стандартах юникода. Если их не под пытками добавили, то я по адресу.

>>А давайте запихнем в юникод знаки вымершей цивилизации, алхимические знаки, древнеегипетский или древнепермское письмо
> Что предлагаешь? Исследователям и учёным вместо символов векторные картинки всталять,
> ты серъёзно?

А ты серьезно предлагаешь сначала на основании недостаточной длины кодирования символа придумать новые кодировки (UTF-16, 32), а потом забивать пространство "кодировки 21 века" плохоизученным древнегипетским? Завтра откопают альтарь ктулху, его символы тоже будешь добавлять? А что насчет графиков? Их тоже векторными картинками вставлять? Зачем такие полумеры? Может тогда сразу к растру перейдем - как кодируется, так и рисуется? Кроме того я не видел в научных кругах никого кто писал бы формулы юникодом (и ты тоже так не делаешь).

>>Так давайте добавим символы заставляющие текст писать справа налево
> Арабский мир щемишь? Они же с лева направо пишут.

Нет, китайцев. Они же сверху вниз пишут и для них ничего такого нет. Или древних ливийцев.  Логично что для кого-то есть а для кого-то нет?

> Ты видимо решил процитировать всю Википедию? Ешё раз тебе говорю, Юникод -
> дна из самых лучших вещей, которое сделало человечество.

Повторяй это почаще.

Ответить | Правка | Наверх | Cообщить модератору

198. "Атака Trojan Source для внедрения изменений в код, незаметны..."  +/
Сообщение от А (??), 05-Ноя-21, 19:51 
Арабский мир пишет справа налево (только цифры слева направо)
Ответить | Правка | К родителю #177 | Наверх | Cообщить модератору

182. "Атака Trojan Source для внедрения изменений в код, незаметны..."  +1 +/
Сообщение от Урри (ok), 03-Ноя-21, 10:33 
Начать надо с того, что вы не отличаете понятия "кодовая страница" и "кодировка".

Чтобы было понятнее, считайте, что UTF-8, UTF-16 и все они - это аналог ZIP, RAR, ARJ для обычного бинарного кода (юникода). И сразу часть претензий снимается, ибо они относятся не к юникоду, а вашим заблуждениям относительно него.

Далее, вы не в курсе, что поляки пишут латиницей. Тоже претензия снимается, хотя выглядит довольно забавно.
-- cut ---------
> Минуточку, а почему сербская А КОДИРУЕТСЯ как русская А?

Потому, что и русская и сербская - кирилличная.

> А польское А это английское А?

Польский алфавит, на секундочку, латинский. Потому, что латинская.

> Ммм... логично?

ДА!

> Просто живи с этим.

Хы.
--------- cut --

> А давайте запихнем в юникод знаки вымершей цивилизации

Да, давайте. Мне нравится писать на древнеегипетском и я теперь могу это спокойно делать. А еще на нем можно программировать.

> Так давайте добавим символы заставляющие текст писать справа налево

Евреи тоже люди, как ни странно, и тоже хотят спокойно писать как привыкли.

> но не добавим символов чтобы писать сверху вниз и снизу верх

Да, хорошо было бы добавить.

> а где взять библиотеки чтобы это отобразить? Удачи, это не наше дело.

Да, не их. С понятием RFC, я так понимаю, вы не знакомы?

> Подскажите шрифт для юникода? Для латиницы вот эти, для русского вот этот, вот этот для математических символов...

https://en.wikipedia.org/wiki/GNU_Unifont - 60691 глиф.

А вообще юзай Anonymous Pro - прекрасный программерский фонт с кириллицей.

> А помните мы решили для каждого символа сделать свою кодировку?

Вы путаете понятия character и letter. Вы путаете понятия "кодирование" и "кодировка".

> несколько видов самого протокола

О, откуда то всплыл какой-то протокол. Вы еще и что такое "протокол" не в курсе?

--------------------------------------------------------------------------------
Итого:
> Немного грустно что пришли к такому !@#$%, но искать виноватых я не намерен.

Я вам помогу - нету тут виноватых. Просто потому, что никто к такому "!@#$%" не приходил.
Это все ваши голые фантазии, основанные на незнании и ошибочных представлениях о мире.

Ответить | Правка | К родителю #175 | Наверх | Cообщить модератору

183. "Атака Trojan Source для внедрения изменений в код, незаметны..."  +1 +/
Сообщение от keydon (ok), 03-Ноя-21, 12:22 
> Вы путаете понятия character и letter. Вы путаете понятия "кодирование" и "кодировка".
>> несколько видов самого протокола
> О, откуда то всплыл какой-то протокол. Вы еще и что такое "протокол"
> не в курсе?

Мб я и не писал корректно термины в 2 часа ночи, но сути это не меняет. Как были проблемы, так они и остались, а ваши ответы сводятся к "вы назвали отверстие дыркой".

> Начать надо с того, что вы не отличаете понятия "кодовая страница" и
> "кодировка".

В контексте не принципиально.

> Чтобы было понятнее, считайте, что UTF-8, UTF-16 и все они - это
> аналог ZIP, RAR, ARJ для обычного бинарного кода (юникода). И сразу
> часть претензий снимается, ибо они относятся не к юникоду, а вашим
> заблуждениям относительно него.

Спасибо, я в курсе, только проблем это не решает. Нам по-прежнему нужно это учитывать, по-прежнему нужно переформатировать кодировку под разный софт(потому что он не ожидает например unicode с BOM), по-прежнему нужно досконально выбирать либы. Проблем не сильно меньше чем с наличием совершенно разных кодировок. Почему претензии должны быть сняты не понятно.

> Далее, вы не в курсе, что поляки пишут латиницей. Тоже претензия снимается,
> хотя выглядит довольно забавно.
> -- cut ---------
>> Минуточку, а почему сербская А КОДИРУЕТСЯ как русская А?
> Потому, что и русская и сербская - кирилличная.
>> А польское А это английское А?
> Польский алфавит, на секундочку, латинский. Потому, что латинская.

Но претензия была не к польскому, а к различию подходов для разных символов.
Напрашивается очевидные 2 стратегии:
1) похожие символы кодировать одним значением экономя байты (и бонусом есть шанс что пользователь различит 0 от о).
2) каждый символ кодировать своим значением, обеспечивая 100% идентификацию каждого символа и немного упрощая жизнь разработчиков, позволяя например в парсере ограничить русский язык просто фильтруя все что не входит в диапазон русского языка (и для русского в юникоде так и работает, но не для всех языков).
Но юникод СМЕШИВАЕТ оба подхода, нивелирует плюсы и получает минусы от обоих

>> Минуточку, а почему сербская А КОДИРУЕТСЯ как русская А?
> Потому, что и русская и сербская - кирилличная.

По такой логике и кириллическая А это латиница.

>> А давайте запихнем в юникод знаки вымершей цивилизации
> Да, давайте. Мне нравится писать на древнеегипетском и я теперь могу это
> спокойно делать. А еще на нем можно программировать.

Сам пошутил, сам посмеялся. Надеюсь для программирования вы не используете Модификатор эмодзи для шкалы Фицпатрика тип-4 или Заполнитель хангыль чхосон (что это вообще такое?).

Кстати о программировании - в юникоде есть вариантные селекторы что теоритически удобно для программирования, но на практике их никто не использует (по-крайней мере я не знаю об этом).

>> Так давайте добавим символы заставляющие текст писать справа налево
> Евреи тоже люди, как ни странно, и тоже хотят спокойно писать как
> привыкли.
>> но не добавим символов чтобы писать сверху вниз и снизу верх
> Да, хорошо было бы добавить.

Вот и я про то же: кто-то люди, кто-то не люди, зато вы можете на древнеегипетском писать.

>> а где взять библиотеки чтобы это отобразить? Удачи, это не наше дело.
> Да, не их. С понятием RFC, я так понимаю, вы не знакомы?

Почему то многие забывают что стандарты надо писать чтобы им следовали, а не чтобы их написать. Наличие RFC не делает из мифического вечного двигателя решение проблем с получением энергии. И юникод забывает про это больше остальных.

>> Подскажите шрифт для юникода? Для латиницы вот эти, для русского вот этот, вот этот для математических символов...
> https://en.wikipedia.org/wiki/GNU_Unifont - 60691 глиф.

Но он только для части юникода. Я же не хочу чтобы часть символов у меня была одни шрифтом, а часть другим (это если вообще либа так умеет, сочувствую разработчикам что ее писали).

>> А помните мы решили для каждого символа сделать свою кодировку?
> Вы путаете понятия character и letter. Вы путаете понятия "кодирование" и "кодировка".
>> несколько видов самого протокола

Уход от ответа.

Вот вам добавка: коллизии повышения и понижения регистра когда символ из одного алфавита после смены регистра становится ДРУГИМ символом и обратно его не восстановить! БЕСКОНЕЧНО БОЛЬШАЯ СТРОКА КОТОРУЮ НЕЛЬЗЯ РАЗДЕЛЯТЬ потому что она состоит из кучи диакритических знаков, отсутствие(например удаление) каждого меняет букву(ы).

> Я вам помогу - нету тут виноватых. Просто потому, что никто к
> такому "!@#$%" не приходил.
> Это все ваши голые фантазии, основанные на незнании и ошибочных представлениях о
> мире.

Ну да, проблем с юникодом нет, сам стандарт совершенно не переусложнен, каждый второй студент знает его наизусть как ASCII, проблем с его отображением, редактированием нет, для использования уже давно достаточно не парясь подключить какую-нибудь бибилиотеку, каждые полгода не всплывает никаких новостей что приложение N опять можно положить прислав строку на иврите, а сабжевая новость это розыгрыш к следующему 1 апреля. Успокаивайте себя дальше.

Ответить | Правка | Наверх | Cообщить модератору

194. "Атака Trojan Source для внедрения изменений в код, незаметны..."  +/
Сообщение от Урри (ok), 05-Ноя-21, 13:04 
> Но претензия была не к польскому, а к различию подходов для разных символов.

Я вам только что показал, что подход совершенно одинаковый.

Польское "А" - это латинское "А". У поляков письмо - латиница(!). Поэтому их "А" - это английское "А", немецкое "А", фрацузское "А".

Сербское "А" - это кирилличное "А". У сербов письмо - кириллица(!). Поэтому их "А" - это русское "А", болгарское "А", белорусское "А".

Подход - одинаковый. И правильный.

> По такой логике и кириллическая А это латиница.

Перечитайте то, что я написал выше. Погуглите "кириллица" и "история появления кириллицы". Думайте.

> каждый символ кодировать своим значением, обеспечивая 100% идентификацию каждого символа

Оно так и есть. Кирилличная "А" вне зависимости от языка кодируется как кирилличная "А". И даже если какая-нибудь донская область внезапно объявит себя Донской Республикой со своим, Донским Языком (вернет в язык букву ѣ), всем программистам мира не придется переделывать таблицу юникода.

> и немного упрощая жизнь разработчиков, позволяя например в парсере ограничить русский язык просто фильтруя все что не входит в диапазон русского языка (и для русского в юникоде так и работает, но не для всех языков).

Какого именно русского языка - до реформы 1918 или после? Вы предлагаете менять таблицу кодов под каждое изменение национальных правил, заставляя переписывать все парсеры?
Языки, напомню, развиваются. В них появляются и исчезают даже буквы (украинцы вернули букву ґ, например - совершенно непонятно зачем, но закон есть закон). Теперь что, всю украинскую кодировку после "г" сдвигать и все переписывать? А как насчет русской "ё", которая то есть, то нет (гляньте на википедии, там статья почти как война и мир по размеру)?

И, в конце-концов, вам так сложно в парсере сделать бинарный поиск по собственной таблице допустимых национальных символов? Это будет почти так же быстро, как и проверка x <= y <= z,

У меня парсер, например, так и делает. Он даже умеет приводить буквы любого языка из нижнего в верхний регистр - когда выходит обновление таблицы юникода, куда включают новые языки (или меняют правила для уже существующих) я запускаю скрипт, который парсит последнюю редакцию CaseFolding.txt из https://www.unicode.org/Public/ и генерирует мне простую табличку, сложность поиска по которой составляет log(n).

>> Вы путаете понятия character и letter. Вы путаете понятия "кодирование" и "кодировка".
> Уход от ответа.

Слив засчитан. Будем считать, что вы поняли ошибку но решили ее просто замять, ибо слишком позорно.

> коллизии повышения и понижения регистра когда символ из одного алфавита после смены регистра становится ДРУГИМ символом и обратно его не восстановить!

Это особенности естественных языков. Юникод им только следует, не более того.
Да, греческую "ᾙ" действительно можно приводить либо к "ᾑ" либо к "ἡι" - это особенности правописания. И эти особенности отражены в юникоде.

Так что, теперь еще человеческие языки переделывать, вот прям с Плутарха начиная? Для вашего удобства?
Ого как замахнулись.

>> https://en.wikipedia.org/wiki/GNU_Unifont - 60691 глиф.
> Но он только для части юникода.

Вы на английском читать не умеете? Ну тогда понятно откуда такое желание все взять и переделать.
Цитирую:

The Unicode Basic Multilingual Plane covers 216 (65,536) code points. Of this number, 2,048 are reserved for special use as UTF-16 surrogate pairs and 6,400 are reserved for private use. This leaves 57,088 code points to which glyphs can be assigned. Some of these code points are special values that do not have an assigned glyph, but most do have assigned glyphs.

GNU Unifont покрывает ВСЕ ваши потребности в юникоде, причем с запасом. 60691 глифов против 57088 предлагаемых.

> сам стандарт совершенно не переусложнен

Стандарт прост как два байта. Что может быть проще таблицы всех человеческих букв/рун/символов письма?

> каждый второй студент знает его наизусть как ASCII

Я уверен, 999999 ил 1000000 тысяч студентов не скажут код буквы "ё" в любой из кириллических кодировок. Да даже код ETX или SYN из ASCII не скажут, как и вы.

Так что даже тут вы, мягко говоря, облажались.

--
На этом, надеюсь, все? Можете сделать выводы из написанного и немножечко дообразоваться? Или будете просто глупо упираться в свои заблеждения, как всегда делают 95% народонаселения.

Ответить | Правка | Наверх | Cообщить модератору

205. "Атака Trojan Source для внедрения изменений в код, незаметны..."  +/
Сообщение от keydon (ok), 09-Ноя-21, 18:45 
> Подход - одинаковый. И правильный.
> Перечитайте то, что я написал выше. Погуглите "кириллица" и "история появления кириллицы".

Если по происхождению формировать блоки, то по вашей логике кириллица должна использовать глаголицу и например ь в русском должен быть U2C13 а не U042C. Но в юникоде это не так. Т.е. как сделано в юникоде все равно не логично, а если бы и было сделано по такой логике то это все равно был бы кусок !@#$%%^, т.к. логика сводить к историческим причинам крайне не надежно - что там было в древности никто не знает, исторические представления неоднократно переписывались и что делать если на язык воздействовало сразу два языка с одинаковым символом и какой из них оказал большее влияние - не понятно.

> Оно так и есть. Кирилличная "А" вне зависимости от языка кодируется как кирилличная "А". И даже если какая-нибудь донская область внезапно объявит себя Донской Республикой со своим, Донским Языком (вернет в язык букву ѣ), всем программистам мира не придется переделывать таблицу юникода.

Сами юникодовцы придумали проблему - кодировать символы, а не глифы, сами же от нее отказались делая такое "наследование" между схожими алфавитами, сами же придумали планы и разделение внутри планов, самим же пришлось тусовать планы как придется без всякой логики.
Просто кодируйте глифы и не надо никаких заморочек с алфавитами, историей и т.д..

>Какого именно русского языка - до реформы 1918 или после? Вы предлагаете менять таблицу кодов под каждое изменение национальных правил, заставляя переписывать все парсеры?
> Языки, напомню, развиваются. В них появляются и исчезают даже буквы (украинцы вернули букву ґ, например - совершенно непонятно зачем, но закон есть закон). Теперь что, всю украинскую кодировку после "г" сдвигать и все переписывать? А как насчет русской "ё", которая то есть, то нет (гляньте на википедии, там статья почти как война и мир по размеру)?

Я то как раз против разделения по семантике (за глифы и там таких проблем нет принципиально и бнз маппинга принципиально не обойтись). А юникодовцы сами себе проблемы придумали разбивать по блокам и теперь тасуют и блоки как придется и вроде как и не глифы но вроде как и не совсем семантика.

> Это будет почти так же быстро, как и проверка x <= y <= z,

Почти также быстро это логарифмическая сложность против константной? Вы это серьезно?

> Слив засчитан. Будем считать, что вы поняли ошибку но решили ее просто замять, ибо слишком позорно.

Ошибка весьма условная и в кругу дотошных филологов можно долго выяснять что значит кодировка на русском, charset на английском и что они значили до юникода. Все всё поняли, но снобы все равно посмеялись чтобы потешить ЧСВ. Вы же называете логарифмическую сложность почти такой же быстрой как и константную и это уже не смешно.

>Это особенности естественных языков. Юникод им только следует, не более того.
> Да, греческую "ᾙ" действительно можно приводить либо к "ᾑ" либо к "ἡι" - это особенности правописания. И эти особенности отражены в юникоде.

Это особенность семантического разделения. Или недосемантического как в юникоде.

> Стандарт прост как два байта.

Ну да, ну да. Видимо в этой https://www.oreilly.com/library/view/unicode-explained/05961.../ книге первые 10 страниц рассказывается как все просто, а оставшиеся 670 страниц пустые. И в других книгах https://www.unicode.org/announcements/books.html то же самое. И документация только core specification на 1000+ страниц просто была рассчитана на альтернативное использование в виде топки, а не распухла из-за излишней сложности. А бесконечное статьи от опытных разработчиков про проблемы с юникодом это затянувшиеся на несколько лет первоапрельские розыгрыши.

> Что может быть проще таблицы всех человеческих букв/рун/символов письма?

О нет, это до юникода кодировки в основном были таблицами (которые юникод должен был устранить и как раз он первый из популярных перестал отображать конкретный символ в конкретную последовательность бит), а юникод это еще и гигантское количество правил для отображения и в них вся загвоздка.

>Вы на английском читать не умеете? Ну тогда понятно откуда такое желание все взять и переделать.
>Цитирую:
>The Unicode Basic Multilingual Plane covers 216 (65,536) code points. Of this number, 2,048 are reserved for special use as UTF-16 surrogate pairs and 6,400 are reserved for private use. This leaves 57,088 code points to which glyphs can be assigned. Some of these code points are special values that do not have an assigned glyph, but most do have assigned glyphs.
>GNU Unifont покрывает ВСЕ ваши потребности в юникоде, причем с запасом. 60691 глифов против 57088 предлагаемых.

Тогда почитайте получше потому что в цитате вы упустили _Basic_Plane, что значит что шрифт покрывает только базовый план и еще на сайте http://unifoundry.com/unifont/index.html они указывают что поддерживают 12613 глифов plan1, а всего их планов 16 и пускай большая часть не заполнена, но как миниум plan2 в unifont'е нет, а значит и всей поддержки юникода тоже нет.

>Перечитайте то, что я написал выше. Погуглите "кириллица" и "история появления кириллицы". Думайте.
>Слив засчитан. Будем считать, что вы поняли ошибку но решили ее просто замять, ибо слишком позорно.
>Так что, теперь еще человеческие языки переделывать, вот прям с Плутарха начиная? Для вашего удобства?
>Ого как замахнулись.
> Вы на английском читать не умеете? Ну тогда понятно откуда такое желание все взять и переделать.
> На этом, надеюсь, все? Можете сделать выводы из написанного и немножечко дообразоваться? Или будете просто глупо упираться в свои заблеждения, как всегда делают 95% народонаселения.

По делу сказано не много и много неправильного, но спеси как от всех гениев человечества вместе взятых.

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру