Чтение файлов в python

Добрый вечер Евгений и форумчане! Столкнулся с проблемой чтения файлов в python: файлы с обычным текстом в формате las и txt читаются, например:

~Version information
VERS.                            1.20: CWLS LAS  -  VERSION 1.20
WRAP.                              NO: One line per depth step

~Well information

Но если текст такого вида (с абракадаброй):

~Version information block
VERS.                             1.20:Ќ з «м­ п Ј«гЎЁ­  § ¬Ґа
WRAP.                       137.60:Љ®­Ґз­ п Ј«гЎЁ­  § ¬Ґа
TYPE.                                ѓ€‘: ‚Ё¤ ЇҐаҐ¤ ў Ґ¬ле ¤ ­­ле

программа вылетает. Не подскажите как лечится?

We recommend hosting TIMEWEB
We recommend hosting TIMEWEB
Stable hosting, on which the social network EVILEG is located. For projects on Django we recommend VDS hosting.

Do you like it? Share on social networks!

18
Evgenii Legotckoi
  • Sept. 25, 2018, 3:20 a.m.

День добрый!

А киньте код вашей программы, который отвечает за чтение. Возможно, что вы как-то криво читаете кодировку. Может там кодировка, которая имеет меньше байт на символ, которую вы используете, поэтому и вылетает за пределы текстового массива указатель при чтении.


    Вот код:


    import sys

    from re import match

    from vira import *
    from PyQt5 import QtCore, QtGui, QtWidgets
    from PyQt5.QtWidgets import (QDialog, QFileDialog, QMessageBox, QLineEdit, QProgressBar, QProgressDialog)
    from PyQt5.QtCore import QDir, QDirIterator


    class MyWin(QtWidgets.QMainWindow):
    def __init__(self, parent=None):
    QtWidgets.QWidget.__init__(self, parent)
    self.ui = Ui_MainWindow()
    self.ui.setupUi(self)

    # Вешаем на кнопку функцию Open
    self.ui.pushButton.clicked.connect(self.Open)
    self.ui.pushButton_2.clicked.connect(self.close)

    def Open(self):
    self.ui.textEdit.clear()
    files, _ = QFileDialog.getOpenFileNames(self, "Выбрать файлы", "/home", "*.las *.txt")
    hjh = list(filter(lambda x: x != '*.las *.txt', files))
    myString = '\n'.join(hjh)
    self.ui.textEdit.setText(myString)
    if self.ui.comboBox.currentIndex() == 0:
    strx = self.ui.textEdit.toPlainText()
    strxList = strx.split('\n')

    for jk in range(0, len(strxList), 1):
    print(strxList[jk])
    self.ui.textEdit.append(str(strxList[jk]))
    f = open(strxList[jk], 'r')
    for line in f:
    print(line)
    self.ui.textEdit.append(line)
    f.close()

    if __name__ == "__main__":
    app = QtWidgets.QApplication(sys.argv)
    myapp = MyWin()
    myapp.show()
    sys.exit(app.exec_())

      Извиняюсь, не проверил код у себя ещё. В каком именно месте падает? Вы определили это?

      • Вот здесь:
      • for jk in range(0, len(strxList), 1):
      • print(strxList[jk])
      • self.ui.textEdit.append(str(strxList[jk]))
      • f = open(strxList[jk], 'r')
      • for line in f:
      • print(line)
      • self.ui.textEdit.append(line)
      • f.close()
      • strxList - это список файлов считанный с textedit, когда начинаю перебирать каждый элемент списка нормальные файлы читаются и выводятся в консоль и textedit, а когда попадается файл с "абракадаброй" программа вылетает 

          Похоже, что здесь сам вывод print у Python крашится из-за кодировки символов.

          Попрбуйте установить кодировку для потока вывода.

          Что вроде такого может быть

          UTF8Writer = codecs.getwriter('utf8')
          sys.stdout = UTF8Writer(sys.stdout)

            codecs подчеркивается
              import codecs
                import codecs
                for jk in range(0,len(strxList),1):
                print(strxList[jk])
                self.ui.textEdit.append(str(strxList[jk]))
                UTF8Writer = codecs.getwriter ('utf8')
                sys.stdout = UTF8Writer (sys.stdout)
                f = open(strxList[jk], 'r')
                for line in f:
                print(line)
                self.ui.textEdit.append(line)
                f.close()

                  Я правильно скомпоновал код?

                    import codecs

                    Я бы добавил в самом начале файла

                    UTF8Writer = codecs.getwriter ('utf8')
                    sys.stdout = UTF8Writer (sys.stdout)

                    А это я думаю, стоит добавить перед ээтой строкой

                    app = QtWidgets.QApplication(sys.argv)

                      Программа вообще не запускается

                        А что пишет?

                          Evgenii Legotckoi
                          • Sept. 27, 2018, 6:55 a.m.

                          Так, а если тогда просто файл открывать с учётом кодировки?

                          f = codecs.open(filename, encoding="utf-8")

                            Process finished with exit code 3

                              Опять вылетает

                                Решение найдено:

                                f = codecs.open (strxList[jk], 'r', encoding='cp866')

                                  Спасибо Евгений Вам за то что направили на путь истинный!

                                    Пожалуйста, успехов.

                                      Comments

                                      Only authorized users can post comments.
                                      Please, Log in or Sign up
                                      Дмитрий

                                      C ++ - Test 004. Pointers, Arrays and Loops

                                      • Result:60points,
                                      • Rating points-1
                                      Дмитрий

                                      C++ - Тест 003. Условия и циклы

                                      • Result:92points,
                                      • Rating points8
                                      d
                                      • dsfs
                                      • April 26, 2024, 4:56 a.m.

                                      C ++ - Test 004. Pointers, Arrays and Loops

                                      • Result:80points,
                                      • Rating points4
                                      Last comments
                                      k
                                      kmssrFeb. 8, 2024, 6:43 p.m.
                                      Qt Linux - Lesson 001. Autorun Qt application under Linux как сделать автозапуск для флэтпака, который не даёт создавать файлы в ~/.config - вот это вопрос ))
                                      Qt WinAPI - Lesson 007. Working with ICMP Ping in Qt Без строки #include <QRegularExpressionValidator> в заголовочном файле не работает валидатор.
                                      EVA
                                      EVADec. 25, 2023, 10:30 a.m.
                                      Boost - static linking in CMake project under Windows Ошибка LNK1104 часто возникает, когда компоновщик не может найти или открыть файл библиотеки. В вашем случае, это файл libboost_locale-vc142-mt-gd-x64-1_74.lib из библиотеки Boost для C+…
                                      J
                                      JonnyJoDec. 25, 2023, 8:38 a.m.
                                      Boost - static linking in CMake project under Windows Сделал всё по-как у вас, но выдаёт ошибку [build] LINK : fatal error LNK1104: не удается открыть файл "libboost_locale-vc142-mt-gd-x64-1_74.lib" Хоть убей, не могу понять в чём дел…
                                      G
                                      GvozdikDec. 18, 2023, 9:01 p.m.
                                      Qt/C++ - Lesson 056. Connecting the Boost library in Qt for MinGW and MSVC compilers Для решения твой проблемы добавь в файл .pro строчку "LIBS += -lws2_32" она решит проблему , лично мне помогло.
                                      Now discuss on the forum
                                      G
                                      George13May 7, 2024, 12:27 a.m.
                                      добавить qlineseries в функции в функции: "GPlotter::addSeries(QString title, QVector &arr)" я вызываю метод setChart(...), я в конструктор передал адрес на QChartView элемент
                                      BlinCT
                                      BlinCTMay 5, 2024, 5:46 a.m.
                                      Написать свой GraphsView Всем привет. В Qt есть давольно старый обьект дял работы с графиками ChartsView и есть в 6.7 новый но очень сырой и со слабым функционалом GraphsView. По этой причине я хочу написать х…
                                      PS
                                      Peter SonMay 3, 2024, 5:57 p.m.
                                      Best Indian Food Restaurant In Cincinnati OH Ready to embark on a gastronomic journey like no other? Join us at App india restaurant and discover why we're renowned as the Best Indian Food Restaurant In Cincinnati OH . Whether y…
                                      Evgenii Legotckoi
                                      Evgenii LegotckoiMay 2, 2024, 2:07 p.m.
                                      Мобильное приложение на C++Qt и бэкенд к нему на Django Rest Framework Добрый день. По моему мнению - да, но то, что будет касаться вызовов к функционалу Андроида, может создать огромные трудности.
                                      IscanderChe
                                      IscanderCheApril 30, 2024, 4:22 a.m.
                                      Во Flask рендер шаблона не передаётся в браузер Доброе утро! Имеется вот такой шаблон: <!doctype html><html> <head> <title>{{ title }}</title> <link rel="stylesheet" href="{{ url_…

                                      Follow us in social networks