파이썬/데이터

PYTHON PROGRAMMING 기초4 (데이터4)strings 문자열 정리2

공부짱짱열심히하기 2022. 11. 15. 18:09

문자열 추출

문자열은 각각의 문자들의 순서로 되어있으며 원하는 부분만 추출하는게 가능

 


하나의 문자 추출하기

 

데이터 추출을 위해서 데이터 를 인덱스화 시켜 이해하고 필요한 데이터를 찾아서 입력해주면 된다

문자 추출은 데이터 엑세스 기호를 이용하여 변수뒤에 붙여주면된다

그리고 추출할 데이터의 순서 즉 인덱스를 입력해주는데

인덱스는 문자열 데이터 첫단어 0 ~ n번 이라고 생각하면 된다 => index or offset

인덱스라고도 부르기도 하고 오프셋이라고 부르기도 한다

 

데이터1
컴퓨터의 첫 시작은 0번

파이썬기본1)

문자열[ ] =>엑세스

 

이해1)

문자 추출은 데이터 엑세스기호 []로 실행

인덱스는 0 부터 하나씩 올라가는 방식

 

앞에서부터 세도 되고 뒤에서 부터 세도 상관은 없다

이해2)

역방향은 -1부터 시작

 

 


특정문자를 다른 문자로 치환하기

 

문자열의 데이터 내용을 replace 함수로 변경할수 있다.

replace( 바뀔꺼 , 바꿀꺼)로 표현 할수 있다 

 

함수1)

변수.replace( , )

a가 k로 변한 상황
응용 해서 이런식으로 공백으로 치환하여 결과적으로 지워버릴수도 있다.

 

 

 


범위지정하여 가져오기

 

a ~ e까지 가저오시오 같은 문자열 범위내에서 가저올때

파이썬에선 콜른(:)으로 표시를 한다

a : e 로 표현하고

컴퓨터가 이해할수있게 인덱스화 시켜 0 : 4 로 보여준다

하지만 실제로는 0 : 4+1 로 표현해야지 e까지 다 추출이 가능하다

 

[0 :5] 라고 표현해도 상관 없으나 4+1로 표현하면 그 개념을 쉽게 이해할수 있다
처음부터 가저오는 경우는 첫번재 범위에서 공백으로 표현해도 문제가 없다
반대도 마찬가지

 

꼭 시작과 끝이 아닌 중간부터 시작도 가능

파이썬기본2)

문자열[ : ] => ~에서 ~까지 엑세스

  • [:] 처음부터 끝까지
  • [start:] start오프셋부터 끝까지
  • [:end] 처음부터 end-1 오프셋까지
  • [start : end] start오프셋부터 end-1 오프셋까지
  • [start : end : step] step만큼 문자를 건너뛰면서, 위와 동일하게 추출

 

이해3)

[ : ]안에 숫자 끝부분은 생략 가능하고 당연히 여기서도 거꾸로 읽을땐 -n으로 적는다 

 

 

이런식으로 두개씩 거넌 뛰면서도 가능하다

 

 


문자열 관련함수

파이썬기본3)

len(변수)  => 변수안 데이터 문자열 개수

 

 

함수2)

변수.strip() =>문자열 양쪽 끝 공백을 제거

 

원래 이메일 데이타와 스트립으로 공백을 지운 데이터는 다른 데이터로 인식을 했음

 

함수3)

변수.find(' ') => 문자열에서 ' ' 단어가 어디에 위치하는가

year란 단어가 162번째에 존재 한다

 

 

-1 은 인덱스에서 없다고 표현
당연히 대문자 소문자 구분이 된상태로 데이터가 저장이된다

 

함수4)

변수.count(' ') => 문자열 안에 ' '가 몇개가 있는가

 

 

파이썬기본4)

'  ' in 변수 => 변수안에 ' ' 내용이 있니? 없니?

진실 혹은 거짓 으로 판별

함수5)

변수.startswith(' ') => 문자열에서 시작점이 ' ' 로 시작하는가 참 or 거짓

변수.endswith(' ') => 문자열 마지막 지점이 ' ' 로 시작하는가 참 or 거짓

 

 

정리


1.하나의 문자 추출하기

파이썬기본1)
문자열[ ] =>엑세스

이해1)
문자 추출은 데이터 엑세스기호 [ ]로 실행
인덱스는 0 부터 하나씩 올라가는 방식

이해2)
역방향은 -1부터 시작




2.특정문자를 다른 문자로 치환하기


문자열의 데이터 내용을 replace 함수로 변경할수 있다.
replace( 바뀔꺼 , 바꿀꺼)로 표현 할수 있다 

함수1)
변수.replace( , )



3.범위지정하여 가져오기

파이썬기본2)
문자열[ : ] => ~에서 ~까지 엑세스
  • [:] 처음부터 끝까지
  • [start:] start오프셋부터 끝까지
  • [:end] 처음부터 end-1 오프셋까지
  • [start : end] start오프셋부터 end-1 오프셋까지
  • [start : end : step] step만큼 문자를 건너뛰면서, 위와 동일하게 추출

이해3)
[ : ]안에 숫자 끝부분은 생략 가능하고 당연히 여기서도 거꾸로 읽을땐 -n으로 적는다 





4.문자열 관련함수


파이썬기본3)
len(변수)  => 변수안 데이터 문자열 개수

함수2)
변수.strip() =>문자열 양쪽 끝 공백을 제거

함수3)
변수.find(' ') => 문자열에서 ' ' 단어가 어디에 위치하는가

함수4)
변수.count(' ') => 문자열 안에 ' '가 몇개가 있는가

파이썬기본4)
'  ' in 변수 => 변수안에 ' ' 내용이 있니? 없니?

함수5)
변수.startswith(' ') => 문자열에서 시작점이 ' ' 로 시작하는가 참 or 거짓
변수.endswith(' ') => 문자열 마지막 지점이 ' ' 로 시작하는가 참 or 거짓