Этот пост был изначально написан Майклом Хангером в блоге Neo4j.
Поскольку биотехнология является одной из горячих тем столетия, а графические базы данных растут в этом десятилетии, мы подумали, что было бы неплохо собрать вместе исследователей и разработчиков биоинформатики для семинара о применимости графических баз данных в биологических исследование и применение.
К счастью, профессор Леннарт Мартенс, руководитель группы в отделе медицинских исследований белков в VIB и Гентском университете, предложил провести семинар. Поэтому Рик Ван Брюгген и Леннарт Мартенс из Neo Technology организовали семинар и пригласили множество посетителей из разных областей.
26 участников нашли свой путь в живописный конференц-зал Университета Гента (бывший монастырь), чтобы провести целый день, наполненный презентациями, дискуссиями и практическим семинаром. Нас приветствовал плакат в натуральную величину
путей метаболического взаимодействия у людей.
После вступления Леннарта и Рика я
быстро ознакомился с NOSQL и, в частности, с графическими базами данных и их применимостью в широком спектре областей, в том числе со ссылкой на существующие биотехнологические приложения.
Тило Мут, доктор философии Леннарта, работает в области метапротеомики — интересного метода, связывающего фрагменты белка с потенциальными бактериальными мишенями и создающего мета-белки в соответствующих группах. Он представил тему и то, как они использовали графо-ориентированные модели данных, чтобы рассуждать о потенциальных отображениях.
Пабло Пареджа О, нет последовательности! представил
Bio4j исследовательскую базу данных (и платформу) с открытым исходным кодом, объединяющую множество различных источников информации о белках, геномах и таксономии. Bio4j также работает на Neo4j и в настоящее время поддерживает почти 1 млрд. Отношений. (Слайды
1 ,
2 ,
3 )
За время до обеда я ответил на несколько вопросов о Neo4j, особенно о дорожной карте, масштабировании, и мы выделили некоторые подходы к визуализации, такие как
Gephi ,
Cytoscape и
HivePlots .
Во время перерывов и обедов у нас было много интересных дискуссий о науках о жизни в целом, о работе с учеными и отдельных проблемах управления данными.
После обеда Энтони Лиекенс представил
biograph.be систему обнаружения знаний для поиска актуальной информации в области наук о жизни, например белков в реакциях, ранжированных по релевантности их публикации. Система использует алгоритм ранжирования страниц, который реализован с использованием умножения матриц в системе параллельной обработки.
Дэви СувиJanssen Pharmaceutica и
datablend.be представили различные
примеры использования Graph Database из своего опыта работы в крупной фармацевтической компании. Он завершил презентацию введением в реализацию бегущего во времени графа поверх Datomic под названием
FluxGraph .
Затем Тило представил тему семинара «
Графовые базы данных в науках о жизни » и базу данных «Reactome» о путях взаимодействия человеческого белка. Он рассказал о некоторых API-интерфейсах Neo4j и о том, как их можно использовать для импорта данных из простых CSV-файлов в графическую базу данных. Участники создали свою среду разработки с
помощью проекта Neo4reactome, который мы подготовили заранее и успешно выполнили импорт.
После импорта данных мы рассмотрели некоторые
варианты использования , сначала визуализируя пути в
веб-интерфейсе Neo4j, а затем выполнили несколько запросов с использованием языка запросов Neo4j
Cypher, чтобы найти определенные белки (HBA и HBB) и пути их взаимодействия.
И пример задачи выглядел так:
Найти общие пути HBA и HBB
Оба белка должны быть вовлечены в определенные пути, которые легко найти путем опроса. Теперь мы хотим получить только те пути, которые имеют оба белка.
START proteinA=node:proteins(accession = "P69905"), proteinB=node:proteins(accession = "P68871") MATCH (proteinA)-[:INVOLVED_IN]->(pathway)<-[:INVOLVED_IN]-(proteinB) RETURN pathway
Полученные результаты
- метаболизм
- Обмен O2 / CO2 в эритроцитах
- Поглощение углекислого газа и выделение кислорода эритроцитами
- Поглощение кислорода и высвобождение углекислого газа эритроцитами
После семинара обсуждения продолжились по широкому кругу тем.
Я хочу еще раз поблагодарить Леннарта Мартенса, Тило Мута и Рика Ван Брюггена за организацию такого замечательного семинара. И, конечно, Пабло Пареджа, Дэви Суви и Энтони Лиекенс за представление.
мы создали группу Google »
neo4j-biotech » и хотели бы пригласить всех присоединиться к этому дискуссионному форуму, чтобы участвовать в беседах в области биотехнологии с коллегами, имеющими аналогичный опыт и словарный запас.