Metadata-Version: 2.1
Name: cgi_processor
Version: 0.1.0
Summary: Модуль для предобработки текстов журнала «Цифровые гуманитарные исследования»
Home-page: https://github.com/nevmenandr/cgi_processor
Author: Boris Orekhov
Author-email: nevmenandr@gmail.com
License: UNKNOWN
Platform: UNKNOWN
Classifier: Programming Language :: Python :: 3
Classifier: License :: OSI Approved :: GNU General Public License v3 or later (GPLv3+)
Classifier: Operating System :: OS Independent
Requires-Python: >=3.7
Description-Content-Type: text/markdown
License-File: LICENSE

# Модуль для предобработки текстовых материалов для журнала «Цифровые гуманитарные исследования»

## Подготовка текстов

В [журнале](https://pushkinskijdom.ru/zhurnal-tsifrovye-issledovaniya/) статьи публикуются с использованием LaTeX. В tex из docx тексты можно перевести с помощью `pandoc`:

```bash
pandoc -s paper.docx -o paper.tex
```

Однако, текстам на русском языке требуется дополнительная обработка, связанная с правильными тире и пробелами по правилам отечественной типографии. Модуль производит все нужные преобразования автоматически. 

Примеры преобразований:

* `с новым 1970-х гг. в XXI в.:` -> `с~новым 1970"~х~гг. в~XXI~в.:`
* `социально"=экономические` -> `социально"=экономические`
* `коллеги - на` -> `коллеги — на`
* `В.И. Ленина` -> `В.\,И.\,Ленина`
* `1978-1984~гг.` -> `1978--1984~гг.`

## Установка

`pip3 install cgi_processor`

## Использование

```python
from cgi_processor import process_file, process_directory

# Обработка одного файла
process_file('example.tex')

# Обработка всех .tex файлов в папке
process_directory('./texts')
```

В результате исполнения этого кода в исходной папке появляется файл с тем же именем, но суффиксом `_processed`, например:

`volodin.tex` -> `volodin_processed.tex`

## Другие ресурсы

Веб-сервис с альтернативным функционалом (не полностью совпадающим с текущим) можно найти [здесь](http://nevmenandr.net/cgi-bin/texconv.py). [Репозиторий](https://github.com/nevmenandr/TexTransform) проекта. 


