kelebril: (Default)
[personal profile] kelebril
Даже и не знаю, как его назвать. Работаю с текстом, отпечатанным в ворде крайне небрежно: пробелов между словами - от одного до четырех, пробелы после знаков препинания отсутствуют в принципе. Так я ж прежде всего убрала лишние пробелы и добавила недостающие. Хотя прекрасно понимаю, что как минимум треть текста все равно придется сокращать, полоса-то не резиновая... но не могу даже сокращать при таком безобразном оформлении. Вот как это называется, а?

Date: 2006-11-01 09:30 pm (UTC)
From: [identity profile] besm6.livejournal.com
Данная конкретная операция называется "приведение текста в хотя бы теоретически читабельный вид". Ну, понятно, если она все-таки компьютеру поручается, а не вручную...

Date: 2006-11-01 09:57 pm (UTC)
From: [identity profile] kelebril.livejournal.com
А я не знаю, как ее компьютеру поручить... так что все сугубо ручками. 8-) Читать-то вполне можно. Но неприятно, потому что некрасиво.

Date: 2006-11-02 12:05 am (UTC)
From: [identity profile] besm6.livejournal.com
Путь более длинный, но более простой для понимания. Правка->Замена, "." на ". ", Заменить все, по всему тексту. Потом то же для запятой, восклицательного и вопросительного знаков. Потом два пробела - на один, и так несколько раз, пока не скажет, что не нашел чего еще заменить. Потом " )" на ")", чтобы убрать лишние пробелы перед закрывающими скобками, если они появились на первом шаге. Можно записать как макрос, чтоб каждый раз все эти телодвижения не проводить. Ошибки набора, в общем, перечислены типичные. При записи как макрос вместо "два пробела на один несколько раз" записать "пять пробелов на один", "три пробела на один", "два пробела на один". Если встречаются документы, где больше семи пробелов подряд - развить ряд влево как последовательность Фибоначчи (каждое следующее значение - сумма двух предыдущих, т.е. 8, 13, 21, ...) :-)

Путь более короткий и правильный, но требующий некоторого предварительного самообразования. Почитать в хелпе, как вводятся регулярные выражения. Для первого прогона используется выражение "один из символов ., ,, ! или ?, за которым следует символ, не являющийся закрывающей скобкой". Заменяется на "первый символ, пробел, второй символ". В перле выражение выглядело бы s/([.,!?])([^)])/\1 \2/g. В ворде оно пишется как-то иначе, надо смотреть в хелпе, как. Второй прогон - "более одного пробела" заменяем на "один пробел". В том же перле - s/ +/ /g (в HTML-форматировании может пропасть - между первым / и + два пробела. С одним тоже работать будет, но будет менять все пробелы, что может оказаться дольше, чем хотелось бы.) Заменяется точно так же, по всему тексту не глядя. Этот способ я бы всем огульно рекомендовать не стал - практика показывает, что мышление регулярными выражениями требует определенного поворота мозгов, который есть далеко не у всех. Хотя выразительные возможности их много выше, чем у простой замены, так что если понять принцип и набрать чуть-чуть опыта удалось, то усилия, потраченные на образование, окупаются. Правда, Сэнта, помнится, говорила, что у ворда с реализацией регулярных выражений в полном объеме не срослось. Что именно не срослось - не помню. Не исключу, что фокус "\1 \2" (т.е. выделить в искомом две подгруппы, которые в замене использовать раздельно) может не получиться...

Date: 2006-11-02 12:07 am (UTC)
From: [identity profile] besm6.livejournal.com
Во второй паре кавычек в предыдущем комментарии пробел плохо видно. Он там есть. Сразу после точки (т.е. меняем просто точку на "точка пробел").

с текстом

Date: 2006-11-01 10:54 pm (UTC)
From: [identity profile] frema-zhu.livejournal.com
...и перед тем, как выбросить в корзину, заменил "бог" на "обстоятельства"...
А так там есть "едит -- замена -- два пробела на один" -- и так до нуля в остатке. И точку просто заменить на точку с пробелом после. На ф-сякий случай: абзац обозначается в замене ^p, а скользящий абзац (шифт-энтер) ^l. А пробелы просто отбиваешь, их там не видно.

Re: с текстом

Date: 2006-11-01 10:59 pm (UTC)
From: [identity profile] kelebril.livejournal.com
Хе, точку заменить. Там та же фигня и после запятых, и тире, и кавычек... была. Я уже вручную все исправила, кстати, не так уж много времени это и заняло.

Re: с текстом

Date: 2006-11-02 08:29 am (UTC)
vitus_wagner: My photo 2005 (Default)
From: [personal profile] vitus_wagner
В общем получается наборчик из десятка простых замен (или 4-5 регулярных выражений). Записать его в макрос и повесить на какую-нибудь кнопку на тулбаре.

Re: с текстом

Date: 2006-11-02 08:59 am (UTC)
From: [identity profile] kelebril.livejournal.com
Да мне в первый раз такое безобразие попалось. То есть обычно-то я интервью на диктофон записываю, я же и расшифровываю, с должным количеством пробелов где надо. А тут... даже и не знаю, кто набивал - сам бард или с напечатанных им листочков какая-нибудь девочка при редакции.

Re: с текстом

Date: 2006-11-02 09:11 am (UTC)
vitus_wagner: My photo 2005 (Default)
From: [personal profile] vitus_wagner
Ну первый раз это действительно ещё не повод создавать себе специальный инструмент. Я обычно жду третьего раза.
В первый раз с матом делаю руками, второй раз понимаю что задача будет повторяться, и анализирую различия с первым (в процессе деланья руками уже теми средствами, которыми потом будет пользоваться инструмент), а уж на третий раз делаю инструмент.

Но вот как раз данная задача очень у многих людей возникает систематически. Советы и мои, и [livejournal.com profile] besm6 основаны на личном опыте.

Re: с текстом

Date: 2006-11-02 08:31 am (UTC)
vitus_wagner: My photo 2005 (Default)
From: [personal profile] vitus_wagner
Вообще, как показывает моя практика (правда, не в Ворде, а в vim) самой сложной задачей является замена " на « и ». При вводе текста Word это сам делает, а по готовому - задача нетривиальная. Особенно если вложенные кавычки попадаются.

кривой текст

Date: 2006-11-02 08:16 am (UTC)
From: [identity profile] nina-chatte.livejournal.com
Нормальное качество. Я, когда очередную мамину статью читаю, так всегда правлю (помимо прочего) два пробела на один, уже глаз видит, где расстояние не то.

С теплым пушистым приветом
Нина

Date: 2006-11-14 01:18 am (UTC)
From: [identity profile] bbzhukov.livejournal.com
Вот как это называется, а?
Перфекционизм. Я сам делаю так же и не стыжусь. Потому что иначе по мере чтения непоправленного текста я начинаю все сильнее ненавидеть автора - а это неправильно и непродуктивно.
А если текст нужно сократить, то от такой привычки есть и прямая польза: убьешь лишние пробелы - глядишь, процентов 20 работы уже сделано без малейших потерь для смысла и стиля. Прямо-таки теорема Котельникова :-).
Page generated Feb. 11th, 2026 12:15 pm
Powered by Dreamwidth Studios