728x90

파일 입출력이나 크롤링을 할때 텍스트파일 형식으로 저장하는 경우가 많다.

소켓통신을 리눅스기반에서 윈도우로 파일을 보내거나 그 반대의 경우는 서로 사용하는 문자에서 호환이 되지않아 열지 못하는 경우가 발생할 수있다.

 

그것을 해결하고자 쓸 수 있는 방법이다.

 

import socket
import sys
import os
import time
import re


fw = open("tf.txt", "rt", encoding='utf-8')
fc = open("out.txt", "wt", encoding='utf-8')
   copydata = fw.read()
   parse = re.sub('[‘’]', '', copydata)
   fc.write(parse)
   fc.close()
   fw.close()

parse 부분을 보면 re.sub을 이용해서 특수 문자를 제거 할 수 있다.

re.sub의 사용법은 re.sub('[제거할 특수문자]','교체될 내용(빈칸으로두면 특수문자만 사라진다)',읽어올 데이터)

이런 형식으로 사용하면 된다.

728x90

+ Recent posts