Lee JunHaeng

aka rainygirl

Software Engineer, Technology Journalist based in Seoul

인디스트릿 공연정보/밴드/뮤지션/공연장 데이터 공개

2011년부터 2018년까지 운영되었던 인디스트릿의 공연/뮤지션/공연장 데이터를 CC BY 라이센스 로 공개합니다.

인디스트릿 데이터 github

구 인디스트릿 스크린샷

데이터 구성

musician_json/*.json

뮤지션/밴드 json 데이터입니다. 뮤지션/밴드의 이름, 장르, 프로필 정보, 공연 이력, 함께 공연한 뮤지션 순위, 주요 유투브 주소, 발매한 앨범 정보, 음원을 공개했던 Soundcloud나 Bandcamp 주소 등이 담겨 있습니다.

venue_json/*.json

공연장 json 데이터입니다. 공연장 이름, 주소, 위/경도, 공연 이력, 주로 공연한 뮤지션 순위 등의 데이터가 담겨 있습니다.

musician.csv

뮤지션/밴드 json의 인덱스 csv 입니다. musician_id, filename, event_count 값으로 구성되어 있습니다. event_count는 총 공연횟수 입니다.

venue.csv

공연장 json의 인덱스 csv 입니다. venue_id, filename, address, lat, lng, event_count 값으로 구성되어 있습니다.

이 데이터를 쉽게 확인할 수 있는 웹서비스를 다시 만들까?라는 생각을 해보기도 했어요. 하지만, 저는 데이터를 공개하고, 공개 데이터를 활용하여 씬의 더 많은 개발자 분들이 더 새로운 프로젝트를 다양하게 시작하는 것도 한국 인디 씬에 유익할 거란 생각이 들었습니다.

인디스트릿의 시작

인디스트릿은 2011년부터 2018년까지 운영된, 인디뮤지션/밴드의 공연일정을 모아 전하는 서비스였습니다. 공연일정을 전하는 것은 뮤지션/밴드와 공연장을 소개하는 것이기도 합니다. 인디스트릿에는 총 7년간 공연을 펼친 6,100여건의 국내 인디씬 뮤지션/밴드 프로필이 모여있었고, 900여곳의 국내 공연장 정보, 그리고 16,800여건의 국내 공연 정보가 모여있었습니다.

회사를 다니면서 사이드 프로젝트로 가동하기엔 인디스트릿은 적당한 규모의 서비스였습니다. 공연일정은 공연장의 안내 공지 카페글을 로봇이 크롤링하고 분석해서 자동으로 입력하게끔 만들었습니다. 빠트린 공연은 뮤지션/밴드나 클럽 매니저들이 알아서 올릴 수 있도록 등록 폼도 마련했었습니다. 크롤링 로봇이 도는 서버는 라즈베리파이에 담아 집 단자함에 넣어버렸어요. 라즈베리파이가 과열로 한번 터진 것 외에 별 문제는 없었습니다. 당시에는 워낙 저렴한 조건의 서버를 쓰고 있어서 웹서비스를 굴리는 비용도 부담되지 않았습니다.

이 서비스에 밴드들도 공연장들도, 그리고 팬들도 크게 의존하고 있다는 것을 알게 되면서, 어쩐지 인디 씬이 좀 더 성장하는데에, 밴드 친구들이 좀 더 반짝반짝해지는데에 도움이 되면 좋겠다는 바램이 생겼었습니다. 그래서 공연일정을 정기적으로 배달하는 트위터, 페이스북 봇을 만들어 가동했어요. 뮤지션을 팔로우하면 다가오는 공연일정을 푸쉬 알림으로 알려주는 모바일 어플을 만들기도 했습니다. 공연 참석여부를 체크한 데이터를 바탕으로 공연장 단골 팬을 보여준다거나, 홍대 일대의 공연장 지도를 그려준다거나, 모든 공연일정을 영어나 일어로 바꾸어 보여준다거나 하는 기능을 넣어보기도 했어요. 공연 비디오를 랜덤으로 틀어주는 TV같은 서비스도 만들고, 뮤지션들의 십시일반으로 보낸 음악을 무작위로 편성해 틀어주는 라디오를 만들기도 했어요. 이 라디오 채널은 꽤나 애착이 있었는데요, 인디밴드/뮤지션들의 음악이 늘 정기적으로 소개되는 영국이나 호주 공영방송 라디오 같은 채널이 있었으면 한다는 꿈이 있었거든요. 우연히 들은 음악이 마음에 들어 뮤지션을 찾아보고, 공연장까지 찾아오게 된다면 그것으로 목표를 달성하는 것이라 생각했습니다. 기술적으로는 옛날 세이클럽 라디오와 크게 다르지 않아서 이 역시 만들기는 어렵지 않았어요.

인디스트릿 같은 공연정보 웹서비스를 만들자는 이야기는 오래전부터 제 주변 친구들과 함께 고민해오던 주제였습니다. 홍대 라이브클럽의 시초인 재머스에서 일하던 친구가 10여년 전부터 공연일정을 프린터로 뽑아다가 홍대 일대 전봇대마다 붙이고 다녔거든요. 주변에 밴드하는 친구들도 많이 있었고, 공연에 함께하고 고기먹고 술먹을 때마다 공연장에 새 팬이 더 많았으면 좋겠다는 한탄이 이어졌어요. 사실 공연장에 갈때마다 늘 오던 사람만 오곤 했거든요. 이전에도 비슷한 서비스를 만들려던 이들과 교류한 일도 있었고, 세계 주요 도시마다 Gig Guide 를 제공하는 서비스가 하나씩은 있었기 때문에, 어렵지 않게 웹서비스를 설계해 인디스트릿을 런칭할 수 있었습니다. D2F(Direct to Fan) 플랫폼으로 사업화시켜야한다거나 티켓 직접구매를 넣어야한다거나 하는 이야기들이 정말 많이 오갔지만, 거두절미하고 저는 그저 인디스트릿이라는 서비스가 인디 씬이 더 성장하는데에 기여하면 좋겠다는 바램이 1순위였던것 같아요.

홍대 일대 젠트리피케이션이 극심했던 2015년 즈음 많은 공연장들이 문을 닫았어요. 씨클라우드, 바다비 등등. 인디스트릿도 이후 저의 다른 토이서비스들과 함께 문을 닫았습니다.

데이터의 정확성

인디스트릿 데이터는 크롤링봇 그리고 사용자들의 자발적인 등록을 통해 수집된 데이터를 기반으로 합니다. 웹서비스에 익숙치 않은 공연장 매니저 분들이 데이터를 입력할 때도 있었고, 때로는 어플 알림이나 트윗 알림 노출을 노린 스팸 데이터가 등록되는 경우도 있었습니다. Bandcamp 주소 필드에 네이버 카페 주소가 들어있는 경우도 있고, 밴드 이름을 축약형으로 썼다가 다른 이름으로 썼다가 하는 경우도 있었습니다. 중복 정보를 합치기 위해 연관어 묶음을 만들거나 자동완성 UI를 적용하는 등 다양한 노력을 기울였지만 일부 어긋난 데이터가 있을 수 있습니다. 예를들어 ‘스트릿건즈’ 밴드는 ‘스트리트건즈’ ‘스트릿 건즈’ ‘스트릿건즈’ 등으로 꾸준히 새로 등록되는 문제가 있었습니다. 제가 아는 아티스트나 공연장인 경우, 또는 아티스트가 직접 자기 프로필을 관리하는 경우에는 데이터가 정확하겠지만, 그렇지 않아 놓친 경우도 있음을 미리 알려드립니다. 이 데이터는 서비스 종료 시점을 기준으로 최종적으로 동결된 데이터입니다.

데이터 무결성

event_id, musician_id, venue_id 를 참조하십시오.

데이터 구조

밴드/뮤지션 json 데이터 구조

key description
musician_id 밴드/뮤지션 UID
name 밴드/뮤지션 이름
genre 밴드/뮤지션 장르
intro 밴드/뮤지션 소개글
intro_long 밴드/뮤지션 긴 소개글
member 밴드 구성원
twitter 밴드/뮤지션 트위터 주소
facebook 밴드/뮤지션 페이스북 주소
soundcloud_url 밴드/뮤지션 사운드클라우드 주소
bandcamp_url 밴드/뮤지션 밴드캠프 주소
album 밴드/뮤지션 발매 앨범
video 밴드/뮤지션 유투브 등 비디오 주소
event 밴드/뮤지션 공연 이력
regular_musician 함께 공연한 밴드/뮤지션

공연장 json 데이터 구조

key description
venue_id 공연장 UID
name 공연장 이름
address 공연장 주소
lat 공연장 위도
lng 공연장 경도
intro 공연장 소개글
twitter 공연장 트위터 주소
facebook 공연장 페이스북 주소
regular_musician 자주 공연한 밴드/뮤지션
event 공연장 공연 이력

공연장 주소는 2014년 도로명주소 도입 전 번지 주소도 일부 포함되어 있습니다.

공연 이력 json 데이터 구조

key description
event_id 공연 UID
title 공연 제목
venue 공연장 이름
venue_id 공연장 UID
price 티켓 가격 및 구입처
date 공연일자
time 공연시각
intro 공연소개
intro_long 긴 공연소개
lineup 라인업 (musician_id, name)

데이터 사용 라이센스

CC BY 라이센스이기때문에 영리/비영리 어떤 목적에서든 출처 표기 후 자유로이 이용할 수 있습니다. 당연한 이야기지만 어떤 경우에서든 뮤지션/밴드의 퍼블리시티권과 인격권이 우선됩니다.

데이터 재가공 범위

누구나 CC BY 라이센스에 따라 제약 없이 다양한 방법으로 데이터를 재가공하여 사용할 수 있습니다. 웹/모바일 서비스를 만들어도 좋고, 아카이브 자료에 활용해도 좋고, 다른 포맷으로 재가공하여 더 편리한 방법으로 공유해도 좋습니다. 씬을 새로 만드는 마음으로 부디 활용해 주십시오.

새로운 인디 씬

인디스트릿의 데이터를 꺼내기로 한 건 에고펑션에러의 보컬 김민정 님, 개발자이기도 한 밴드 이디어츠의 베이시스트 로토 님의 권유가 있었습니다. 아티스트가 스스로 자신의 역사와 데이터를 쥐고 있어야한다는 취지에 공감했어요.

아티스트들이 저마다 하고싶은 창작을 하고, 그 창작에 팬들이 환호하고, 환호하는 팬들에 힘입어 아티스트들이 다시 창작과 공연을 이어가는 선순환이, 인디음악 씬의 기본 속성이라 생각해요. 서바이벌 경쟁나 랭킹 경쟁이 아니어도, 플랫폼을 향한 헌신이 아니어도, 누구나 언제든지 팬들을 만날 수 있고, 팬들 역시 새 음악과 새 공연에 쉽게 접근할 수 있어야 잘 작동하는 씬일거라 생각해요. 흥한 아티스트가 다른 아티스트를 끌어올리고 그렇게 서로 이어진다면 그것을 성장하는 씬이라 부를 수 있을 것입니다. 비즈니스와 결합된 규모있는 창작 활동이 그 기반 생태계 위에 존재해야한다고 다함께 늘 염두해둔다면 음악과 문화는 더욱 다채로워질 것입니다. 그 기반 플랫폼이 새로운 온라인의 어떤 서비스가 되었든, 역병을 이겨낸 오프라인 로컬 커뮤니티가 되었든, 어느쪽이든 간에 부디 이전과는 다른, 이전으로 돌아가지 않을 새로운 씬을 상상했으면 합니다.

이번에 공개하는 인디스트릿 데이터가 지금까지의 인디 씬이 무척이나 다채로웠다는 것을 보여주는 레퍼런스가 되기를, 새로운 씬을 상상하는데에 조금이나마 보탬이 되기를 기대해봅니다.

새로운 인디스트릿

2021년 2월부터 indistreet.com 주소로 새로운 인디스트릿 서비스를 로토 님이 만들어 운영할 예정입니다. 많은 응원 부탁드립니다.

인디스트릿 데이터 github