코딩/python - 유용한 기능
[python] 크롤링이나 텍스트파일에서 필요없는 특수문자 제거
투비치
2020. 11. 10. 13:24
728x90
파일 입출력이나 크롤링을 할때 텍스트파일 형식으로 저장하는 경우가 많다.
소켓통신을 리눅스기반에서 윈도우로 파일을 보내거나 그 반대의 경우는 서로 사용하는 문자에서 호환이 되지않아 열지 못하는 경우가 발생할 수있다.
그것을 해결하고자 쓸 수 있는 방법이다.
import socket
import sys
import os
import time
import re
fw = open("tf.txt", "rt", encoding='utf-8')
fc = open("out.txt", "wt", encoding='utf-8')
copydata = fw.read()
parse = re.sub('[‘’]', '', copydata)
fc.write(parse)
fc.close()
fw.close()
parse 부분을 보면 re.sub을 이용해서 특수 문자를 제거 할 수 있다.
re.sub의 사용법은 re.sub('[제거할 특수문자]','교체될 내용(빈칸으로두면 특수문자만 사라진다)',읽어올 데이터)
이런 형식으로 사용하면 된다.
728x90