전체 글 224

MySQL에서 id컬럼 만들기

MySQL의 테이블은 파이썬과 다르게 index가 없다 그러다보니 중복된 이름의 데이터를 넣으면 확인할 방법이 까다로운데 그래서 직접 id라는 컬럼을 만들어 관리를 해주면 좋다 PK(Primary key) : 중복값이 들어올 수 없음 NN : NULL값 없음 UN(Unsigned data type ) :부호 없음 (음수가 아닌 숫자) AI(Auto_Increment) : 자동 증가 딱히 ID컬럼을 넣어줄 필요가 없음 알아서 ID의 숫자가 채워지며 자동으로 이동

데이터베이스 2022.12.06

MySQL NotNull/ null없는 컬럼만들기/ 디폴트값 만들기

mysql에서 테이블에 컬럼을 만들때 여러 플래그가 있는데 PK ,NN,UQ,B,UN,ZF,AI,G가 있다. 먼저 NN이란 NotNUll 을 의미하며 null값이 없이 데이터를 저장한다 이렇게 NN에 체크를 할경우 age컬럼이 없이 만들경우 null값이 없이 int는 0 varchar는 공백으로 표시가 된다. 디폴트 만약 null값이 없는 대신 빈공간에 특정 값을 넣고 싶다면 이렇게 넣었을 경우 이렇게 빈공간에 디폴트값이 들어간다

데이터베이스 2022.12.06

MY SQL 테이블안에 데이터 넣기 /여러데이터 넣기

만들어진 테이블안에 데이터를 추가하고 싶을때 sql문으로 insert into (컬럼명1 ,컬럼명2) values('데이터명1' ,'데이터명2'); 데이터를 넣을 컬럼명을먼저 insert해주고 그다음 컬럼순서에 맞게 데이터를 넣어주면 된다 MY SQL에서는 줄이 바뀌어도 ; 까지 인식을해줌 등록이 됬으면 이렇게 생긴걸 클릭을 해주거나 SELECT * FROM 데이터베이스명.테이블명; 을 입력하여 실행시키면 데이터가 들어가 있는걸 확인 할수 있음 만약 특정 컬럼데이터만 넣고싶다면 이렇게 한개만 들어간다. mysql에서 공백은 null값으로 표현 여러데이터 넣기 insert into (컬럼명1 ,컬럼명2) values('데이터명1' ,'데이터명2') , ('데이터명1-1' , '데이터명2-1') 이런식으로 ..

데이터베이스 2022.12.05

MY SQL schema(데이터베이스) 만들기/ 테이블 만들기

작업을할 데이터베이스를 만들고 데이터베이스에 사용할 인코더를 설정해줌 표준값이 utf8과 utf8_general_ci를 설정해주고 apply해주고 나면 그랬을때 아래작업내용 output에 이렇게 활성화된게 표시가 되면 성공적으로 된것. 내가 만든 데이터 베이스로 이동하려면 use 이름 ; 그리고 ctrl + 엔터 이렇게 활성화 되면 데이터베이스 만들기 종료 테이블 만들기 테이블에 우클릭후 create Table을 눌러줘도 되고 저 버튼을 눌러줘도 됨 table name 을 설정하고 필요한 컬럼을 넣어주면 된다 컬럼에 들어갈 데이터타입을 골라주면 되는데 보통 숫자는 INT 문자는 VARCHAR를 써준다 음식에 이름을 위해 name 컬럼을 만들고 VARCHAR를 골랐다. 괄호안에 숫자는 이데이터에 들어갈 최..

데이터베이스 2022.12.05

MySQL 데이터베이스와 워크벤치(Workbench) 연결하기

MySQL :: Download MySQL Workbench MySQL :: Download MySQL Workbench Select Operating System: Select Operating System… Microsoft Windows Ubuntu Linux Red Hat Enterprise Linux / Oracle Linux Fedora macOS Source Code Select OS Version: All Windows (x86, 64-bit) Recommended Download: Other Downloads: Windows (x86, 64-bit), M dev.mysql.com 노란색 포인트 부분을 누르면 계정없이 설치가 가능하다 1. 사용할 이름 아무이름이나 해도 상관없음 2. 엔드포..

데이터베이스 2022.12.05

[머신러닝7] 계층적 군집 알고리즘: Hierarchical Clustering / Dendogram

Hierarchical Clustering 계층적 군집이란 가까운 두개데이터끼리 묶고 또 그 묶음과 가까운 데이터를 묶고 이런식으로 완전히 모든 데이터가 묶일때 까지 작업하는 알고리즘 유사 개채끼리 계속 군집화를 수행하다 보니 k-means와 달리 클러스팅갯수를 사전에 정하지 않아도가능하다 개체들이 결합되는 순서를 나타내는 트리형태의 구조인 덴드로그램을 통해 시각적으로 k의 갯수를 쉽게 정할 수 있다. 데이터는 수입별 구매점수를 의미 이데이터를 통해 군집화하여 최적의 그룹으로 나누기 트레이닝 기본 1. nan확인 2.x와y분리 언수퍼 바이즈드 러닝은 결과값이 없기때문에 x데이터는 존재하지만 y데이터는 존재하지 않는다 3.문자열이 있다면 숫자로 바궈주기 4.피셔츠케일링을 통해 값 맞춰주기 5.트레이닝 / ..

[머신러닝6] 데이터평균군집 알고리즘: K-means

unsupervised는 결과값을 정하는 supervised 머신러닝과 다르게 데이터를 군집(클러스팅)화 하여 자동으로 묶어주는 머신러닝을 의미한다 k-means 알고리즘이란 데이터를 k개의 묶음을 정해 그거리의 평균을 내는 알고리즘을 뜻한다. 아직 군집이 정해지지 않은 데이터 무리들 사이에 임의점 점(좌표)를 찍고 그 좌표를 중심으로선을 나눠 집단을 형성 그리고 또다른 좌표를 찍고 다시 선을 그어 데이터가 나눠보면서 계속해서 이과정을 반복을한다. 이과정을 반복하다가 더이상 데이터의 변동이 일어나지 않을때 최적의 클러스팅을 찾은것 데이터는 수입별 구매점수를 의미 이데이터를 통해 여러 소비군집을 나누기 트레이닝 기본 1. nan확인 2.x와y분리 언수퍼 바이즈드 러닝은 결과값이 없기때문에 x데이터는 존재하..

AWS의 RDS에 새로운 데이터베이스 구축하기

아마존에서 운영하는 관계형 데이터베이스( RDS)를 클라우드형으로 구축을해 다른 지역에서도 쉽고 경제적이게 서버를 만들고 관리를 할 수잇는 웹 서비스. 무료 클라우드 컴퓨팅 서비스 - AWS 프리 티어 (amazon.com) 무료 클라우드 컴퓨팅 서비스 - AWS 프리 티어 Q: AWS 프리 티어란 무엇입니까? AWS 프리 티어는 고객에게 서비스별로 지정된 한도 내에서 무료로 AWS 서비스를 살펴보고 사용해 볼 수 있는 기능을 제공합니다. 프리 티어는 12개월 프리 티어, 상 aws.amazon.com 서버 사용량에따라 금액이 달라지니 계좌를 연결해서 회원가입을 해줘야한다. 가입이 끝나면 데이터 생성을 누르기전 먼저 리전을 설정을 해줘야한다. 가까운 지역의 서버일수록 당연히 속도가 빠르기 때문에 서울에다..

데이터베이스 2022.12.05

[머신러닝5] 의사결정나무: Decision Tree / Random Forest

Decision Tree 선하나로 분류가 불가능한 경우 데이터의 규칙을 통해 반씩 쪼개가면서 마치 스무고개하듯 가지치기를 하는 분류를 말한다 동일하게 연봉과 나이 성별, 구매여부가 있는 데이터 이데이터를 Decision Tree를 통해 새로운데이터가 나타났을때 관측값 데이터를 기준에 따라 나눠논 알고리즘을 통해 결과값 도출 트레이닝 기본 1. nan확인 2.x와y분리 3.문자열이 있다면 숫자로 바궈주기 4.피셔츠케일링을 통해 값 맞춰주기 5.트레이닝 / 테스트 셋으로 분리시키기 [머신러닝0] 머신러닝의 기초(총정리) (tistory.com) [머신러닝0] 머신러닝의 기초(총정리) 머신러닝이란 데이터를 이용하여 데이터 특성과 패턴을 학습하여 그결과 밭으로 미지의 데이터에 대한 결과값을 예측하는것 머신러닝의..

가장 적합한 매개변수찾기: grid search

[머신러닝4] Support Vector Machine (tistory.com) [머신러닝4] Support Vector Machine 서포트 벡터 머신 서포트 벡터머신이란 데이터를 분류하는 선중에 마진을 최대화 하는 경계면을 찾아서 나눠준다 마진이란 데이터를 분류해서 나눴을때 그 분류에서 가장 먼 데이터끼리의 사 seonggongstory.tistory.com 이렇게 커널값 하나만으로 정확도 차이가 많이 나기 때문에 이데이터 프레임에 맞는 정확도 높은 커널을 찾기 위해 여러번 작업을 해야한다. 그런 수고를 덜기위해 그리드 서치가 있다 Grid Search 그리드 서치란 머신러닝중 여러 하이퍼파라미터 값 조합을두고 가능한 모든 조합을 시도해보는 라이브러리를 뜻한다. from sklearn.model_se..