본문 바로가기

ComputerScience/Database 이론

[Database] 1. 데이터베이스를 시작하기에 앞서 | 데이터베이스 정의

 

안녕하세요. CS지식 정리도 할 겸, 학교에서 배운 데이터베이스 개념 + "데이터베이스 개론-IT COOKBOOK" 의 책을 공부하며 알게 된 내용을 정리할 것입니다. 이번 포스트는 데이터와 정보의 차이, 데이터 type, 데이터베이스 개념을 간단하게 정리 할 것입니다. 주관적으로 작성된 글이기에 틀린 내용이 있을 수 있습니다.(댓글로 알려주시면 감사합니다.)

 

"데이터 베이스가 왜 필요한가?..." 요즘 iOS앱으로 개발을 즐겨하는데 가장 중요한게 데이터라고 생각합니다... (여행 앱을 만드는데 여행지에 필요한 가공된 데이터는 비싼 가격을 지불해야만 이용할 수 있는 api들이 많더라구요 ㅠㅠ)

1. 데이터와 정보

데이터(data)는 현실 세계에서 단순 관찰, 측정을 통해 수집한 것을 의미합니다. 

정보(information)는 데이터를 의사 결정에 유용하게 활용할 수 있게 가공, 처리한 결과물입니다.

 

정보 처리는 수 많은 데이터 중에 사용하고 싶은 정보를 추출하는 과정, 방법입니다.

정보를 수집, 저장할 수도 있어야 하지만, 때에 따라서 그 정보를 찾아서 사용할 수 도 있어야 합니다. 정보 처리는 데이터베이스가 담당합니다. 즉 데이터 모아둔 창고 == 데이터베이스

 

정보 시스템(Information system)

현실세계에서 발생한 데이터는 DB(DataBase)에 저장할 수도 있고, 특정 데이터만 꺼내서 사용자, 의사 결정자에게 정보를 제공할 수 있습니다. 이러한 시스템을 정보 시스템이라고 합니다.

2. 데이터베이스 정의

데이터베이스는 group의 여러 사용자가 data를 shared(공유), stored(저장), integrated(통합), operated(운영)하기 위한 data 집합입니다.

 

여러 사용자가 data set을 이용하기 위해서는 db를 구성할 때 누구라도 쉽게 알 수 있게 정의 되야 합니다. 또한 같은 데이터가 중복되서 저장되면 안되기에 데이터 통합에 힘써야 합니다. 데이터베이스를 저장한다는 것은 결국 컴퓨터에서 접근 가능한 매체(HDD,SSD ...)에 저장해야 합니다. 

 

데이터베이스는 실시간으로 접근(rea-time accessibility)이 가능해야 하고 여러 사람과 함께 공유(concurrent sharing)될 수 있어야 합니다. 봄->여름->가을->겨울과 같이 계절이 변화하듯 현실세계의 데이터 또한 변화(continuous evelution)할 수 있습니다. 한번 입력된 데이터는 자동으로 업데이트 되지 않기에 삽입, 삭제, 수정을 하여 갱신해야 합니다. 메모리의 주소를 검색해야 value를 알 수 있는게 아닌, 내용을 입력했을 때 참조(content reference)할 수 있어야 합니다. 

3. Data type

교수님의 설명으로 한번에 이해가 갔었는데.. 일반적인 데이터 형태는 3가지로 분류할 수 있습니다.

1. 정형 데이터(Structured data)(schema와 같은 미리 정해진 데이터 구조)는 table또는 액셀을 떠올리면 쉽습니다.

2. 반 정형 데이터(Semi-structured data)(구조에 대한 설명이 같이 들어있음)는 JSON 또는 XML을 떠올릴 수 있습니다.

 

let jsonStr = "{\"이름\":\"홍길동\"}"

// {
//   "이름" : "홍길동"
// }

 

반 정형 데이터 중 JSON 타입은 정말 친절하게 value 왼쪽에 key로 value에 대한 설명을 나타낼 수 있습니다. " key : value "

 

3. 비 정형 데이터(Unstructured data).. binary data를 떠올릴 수있는데,, 영상, 이미지, PDF문서와 같이 정해진 구조가 없는 데이터를 의미합니다.


정성적 데이터: 주관적인 해석과 감정을 포착하고 분석하는데 사용되는.. 주관적인 특성, 품질, 의견, 인식 등을 나타내는 데이터를 의미합니다. 비정형 데이터로써 텍스트 형식으로 기록됩니다.

 

정량적 데이터: 수치나 양으로 표현되는 데이터입니다. 측정 가능하고 구조화 된 정보를 나타냅니다. 정형 데이터, 반 정형 데이터로써 통계 분석, 예측 모델링 등과 같은 정량적(정밀하고 통계적이며 수치적인 측정)인 방법을 사용해 분석합니다.

 

 

틀린 부분 발견 시 댓글로 남겨주시면 정말 감사합니다.