Почему я создал решатель символов Java?
Несколько лет назад я начал использовать JavaParser, а затем начал вносить свой вклад. Через некоторое время я понял, что многие операции, которые мы хотим выполнить над Java-кодом, нельзя выполнить просто с помощью абстрактного синтаксического дерева, созданного синтаксическим анализатором, нам также необходимо разрешить типы, символы и вызовы методов. По этой причине я создал JavaSymbolSolver . Сейчас он используется для создания инструментов статического анализа Коати .
Единственное, чего не хватает, так это документации: люди открывают проблемы на JavaParser, спрашивая, как ответить на определенный вопрос, и ответ часто таков: «Для этого вам нужно использовать JavaSymbolSolver». Исходя из этих вопросов, я покажу несколько примеров.
Вдохновленный этой проблемой, я покажу, как составить список всех вызовов определенного метода.
Как мы можем разрешить вызовы методов в Java, используя java-symbol-solver?
Это можно сделать в два этапа:
- Вы используете JavaParser в исходном коде для создания ваших AST
- Вы вызываете JavaSymbolSolver на узлах AST, представляющих вызовы методов, и получаете ответ
Мы собираемся написать короткий пример. В конце мы получим приложение, которое с учетом исходного файла будет производить это:
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
|
* L55 setId( id ) -&qt; com.github.javaparser.ast.body.VariableDeclarator.setId(com.github.javaparser.ast.body.VariableDeclaratorId) * L59 setId(new VariableDeclaratorId(variableName)) -&qt; com.github.javaparser.ast.body.VariableDeclarator.setId(com.github.javaparser.ast.body.VariableDeclaratorId) * L71 setId( id ) -&qt; com.github.javaparser.ast.body.VariableDeclarator.setId(com.github.javaparser.ast.body.VariableDeclaratorId) * L72 setInit(init) -&qt; com.github.javaparser.ast.body.VariableDeclarator.setInit(com.github.javaparser.ast. expr .Expression) * L76 setId(new VariableDeclaratorId(variableName)) -&qt; com.github.javaparser.ast.body.VariableDeclarator.setId(com.github.javaparser.ast.body.VariableDeclaratorId) * L77 setInit(init) -&qt; com.github.javaparser.ast.body.VariableDeclarator.setInit(com.github.javaparser.ast. expr .Expression) * L82 setId( id ) -&qt; com.github.javaparser.ast.body.VariableDeclarator.setId(com.github.javaparser.ast.body.VariableDeclaratorId) * L83 setInit(init) -&qt; com.github.javaparser.ast.body.VariableDeclarator.setInit(com.github.javaparser.ast. expr .Expression) * L88 v .visit(this, arg) -&qt; com.github.javaparser.ast.visitor.GenericVisitor.visit(com.github.javaparser.ast.body.VariableDeclarator, A) * L93 v .visit(this, arg) -&qt; com.github.javaparser.ast.visitor.VoidVisitor.visit(com.github.javaparser.ast.body.VariableDeclarator, A) * L106 setAsParentNodeOf(this. id ) -&qt; com.github.javaparser.ast.Node.setAsParentNodeOf(com.github.javaparser.ast.Node) * L112 setAsParentNodeOf(this.init) -&qt; com.github.javaparser.ast.Node.setAsParentNodeOf(com.github.javaparser.ast.Node) * L121 setAsParentNodeOf(this.init) -&qt; com.github.javaparser.ast.Node.setAsParentNodeOf(com.github.javaparser.ast.Node) * L128 getParentNodeOfType(NodeWithElementType.class) -&qt; com.github.javaparser.ast.Node.getParentNodeOfType(java.lang.Class<T&qt;) * L130 wrapInArrayTypes(elementType.getElementType(), elementType.getArrayBracketPairsAfterElementType(), getId().getArrayBracketPairsAfterId()) -&qt; com.github.javaparser.ast. type .ArrayType.wrapInArrayTypes(com.github.javaparser.ast. type .Type, java.util.List<com.github.javaparser.ast.ArrayBracketPair&qt;...) * L130 elementType.getElementType() -&qt; com.github.javaparser.ast.nodeTypes.NodeWithElementType.getElementType() * L131 elementType.getArrayBracketPairsAfterElementType() -&qt; com.github.javaparser.ast.nodeTypes.NodeWithElementType.getArrayBracketPairsAfterElementType() * L132 getId().getArrayBracketPairsAfterId() -&qt; com.github.javaparser.ast.body.VariableDeclaratorId.getArrayBracketPairsAfterId() * L132 getId() -&qt; com.github.javaparser.ast.body.VariableDeclarator.getId() * L137 ArrayType.unwrapArrayTypes( type ) -&qt; com.github.javaparser.ast. type .ArrayType.unwrapArrayTypes(com.github.javaparser.ast. type .Type) * L138 getParentNodeOfType(NodeWithElementType.class) -&qt; com.github.javaparser.ast.Node.getParentNodeOfType(java.lang.Class<T&qt;) * L142 nodeWithElementType.setElementType(unwrapped.a) -&qt; com.github.javaparser.ast.nodeTypes.NodeWithElementType.setElementType(com.github.javaparser.ast. type .Type<?&qt;) * L143 nodeWithElementType.setArrayBracketPairsAfterElementType(null) -&qt; com.github.javaparser.ast.nodeTypes.NodeWithElementType.setArrayBracketPairsAfterElementType(java.util.List<com.github.javaparser.ast.ArrayBracketPair&qt;) * L144 getId().setArrayBracketPairsAfterId(unwrapped.b) -&qt; com.github.javaparser.ast.body.VariableDeclaratorId.setArrayBracketPairsAfterId(java.util.List<com.github.javaparser.ast.ArrayBracketPair&qt;) * L144 getId() -&qt; com.github.javaparser.ast.body.VariableDeclarator.getId() |
когда выполняется на этом исходном файле:
001
002
003
004
005
006
007
008
009
010
011
012
013
014
015
016
017
018
019
020
021
022
023
024
025
026
027
028
029
030
031
032
033
034
035
036
037
038
039
040
041
042
043
044
045
046
047
048
049
050
051
052
053
054
055
056
057
058
059
060
061
062
063
064
065
066
067
068
069
070
071
072
073
074
075
076
077
078
079
080
081
082
083
084
085
086
087
088
089
090
091
092
093
094
095
096
097
098
099
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
|
/* * Copyright (C) 2007-2010 J?lio Vilmar Gesser. * Copyright (C) 2011, 2013-2016 The JavaParser Team. * * This file is part of JavaParser. * * JavaParser can be used either under the terms of * a) the GNU Lesser General Public License as published by * the Free Software Foundation, either version 3 of the License, or * (at your option) any later version. * b) the terms of the Apache License * * You should have received a copy of both licenses in LICENCE.LGPL and * LICENCE.APACHE. Please refer to those files for details. * * JavaParser is distributed in the hope that it will be useful, * but WITHOUT ANY WARRANTY; without even the implied warranty of * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the * GNU Lesser General Public License for more details. */ package com.github.javaparser.ast.body; import com.github.javaparser.Range; import com.github.javaparser.ast.ArrayBracketPair; import com.github.javaparser.ast.Node; import com.github.javaparser.ast.expr.Expression; import com.github.javaparser.ast.expr.NameExpr; import com.github.javaparser.ast.nodeTypes.NodeWithElementType; import com.github.javaparser.ast.nodeTypes.NodeWithType; import com.github.javaparser.ast.type.ArrayType; import com.github.javaparser.ast.type.Type; import com.github.javaparser.ast.visitor.GenericVisitor; import com.github.javaparser.ast.visitor.VoidVisitor; import com.github.javaparser.utils.Pair; import java.util.List; import static com.github.javaparser.ast.type.ArrayType.wrapInArrayTypes; /** * @author Julio Vilmar Gesser */ public final class VariableDeclarator extends Node implements NodeWithType<VariableDeclarator&qt; { private VariableDeclaratorId id; private Expression init; public VariableDeclarator() { } public VariableDeclarator(VariableDeclaratorId id) { setId(id); } public VariableDeclarator(String variableName) { setId( new VariableDeclaratorId(variableName)); } /** * Defines the declaration of a variable. * * @param id The identifier for this variable. IE. The variables name. * @param init What this variable should be initialized to. * An {@link com.github.javaparser.ast.expr.AssignExpr} is unnecessary as the <code&qt;=</code&qt; operator is * already added. */ public VariableDeclarator(VariableDeclaratorId id, Expression init) { setId(id); setInit(init); } public VariableDeclarator(String variableName, Expression init) { setId( new VariableDeclaratorId(variableName)); setInit(init); } public VariableDeclarator(Range range, VariableDeclaratorId id, Expression init) { super (range); setId(id); setInit(init); } @Override public <R, A&qt; R accept(GenericVisitor<R, A&qt; v, A arg) { return v.visit( this , arg); } @Override public <A&qt; void accept(VoidVisitor<A&qt; v, A arg) { v.visit( this , arg); } public VariableDeclaratorId getId() { return id; } public Expression getInit() { return init; } public VariableDeclarator setId(VariableDeclaratorId id) { this .id = id; setAsParentNodeOf( this .id); return this ; } public VariableDeclarator setInit(Expression init) { this .init = init; setAsParentNodeOf( this .init); return this ; } /** * Will create a {@link NameExpr} with the init param */ public VariableDeclarator setInit(String init) { this .init = new NameExpr(init); setAsParentNodeOf( this .init); return this ; } @Override public Type getType() { NodeWithElementType<?&qt; elementType = getParentNodeOfType(NodeWithElementType. class ); return wrapInArrayTypes(elementType.getElementType(), elementType.getArrayBracketPairsAfterElementType(), getId().getArrayBracketPairsAfterId()); } @Override public VariableDeclarator setType(Type type) { Pair<Type, List<ArrayBracketPair&qt;&qt; unwrapped = ArrayType.unwrapArrayTypes(type); NodeWithElementType<?&qt; nodeWithElementType = getParentNodeOfType(NodeWithElementType. class ); if (nodeWithElementType == null ) { throw new IllegalStateException( "Cannot set type without a parent" ); } nodeWithElementType.setElementType(unwrapped.a); nodeWithElementType.setArrayBracketPairsAfterElementType( null ); getId().setArrayBracketPairsAfterId(unwrapped.b); return this ; } } |
Настройка проекта
Мы собираемся использовать Kotlin и Gradle. Наш файл сборки выглядит так:
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
|
buildscript { ext.kotlin_version = '1.0.4' repositories { mavenCentral() maven { name 'JFrog OSS snapshot repo' } jcenter() } dependencies { classpath "org.jetbrains.kotlin:kotlin-gradle-plugin:$kotlin_version" } } apply plugin: 'kotlin' apply plugin: 'application' apply plugin: 'java' apply plugin: 'idea' apply plugin: 'antlr' repositories { mavenLocal() mavenCentral() jcenter() } dependencies { compile "me.tomassetti:java-symbol-solver-core:0.3.1" compile "org.jetbrains.kotlin:kotlin-stdlib:$kotlin_version" compile "org.jetbrains.kotlin:kotlin-reflect:$kotlin_version" testCompile "org.jetbrains.kotlin:kotlin-test:$kotlin_version" testCompile "org.jetbrains.kotlin:kotlin-test-junit:$kotlin_version" testCompile "junit:junit:latest.release" } idea { module { excludeDirs += file( 'src/main/resources' ) } } * L55 setId(id) -&qt; com.github.javaparser.ast.body.VariableDeclarator.setId(com.github.javaparser.ast.body.VariableDeclaratorId) * L59 setId( new VariableDeclaratorId(variableName)) -&qt; com.github.javaparser.ast.body.VariableDeclarator.setId(com.github.javaparser.ast.body.VariableDeclaratorId) * L71 setId(id) -&qt; com.github.javaparser.ast.body.VariableDeclarator.setId(com.github.javaparser.ast.body.VariableDeclaratorId) * L72 setInit(init) -&qt; com.github.javaparser.ast.body.VariableDeclarator.setInit(com.github.javaparser.ast.expr.Expression) * L76 setId( new VariableDeclaratorId(variableName)) -&qt; com.github.javaparser.ast.body.VariableDeclarator.setId(com.github.javaparser.ast.body.VariableDeclaratorId) * L77 setInit(init) -&qt; com.github.javaparser.ast.body.VariableDeclarator.setInit(com.github.javaparser.ast.expr.Expression) * L82 setId(id) -&qt; com.github.javaparser.ast.body.VariableDeclarator.setId(com.github.javaparser.ast.body.VariableDeclaratorId) * L83 setInit(init) -&qt; com.github.javaparser.ast.body.VariableDeclarator.setInit(com.github.javaparser.ast.expr.Expression) * L88 v.visit( this , arg) -&qt; com.github.javaparser.ast.visitor.GenericVisitor.visit(com.github.javaparser.ast.body.VariableDeclarator, A) * L93 v.visit( this , arg) -&qt; com.github.javaparser.ast.visitor.VoidVisitor.visit(com.github.javaparser.ast.body.VariableDeclarator, A) * L106 setAsParentNodeOf( this .id) -&qt; com.github.javaparser.ast.Node.setAsParentNodeOf(com.github.javaparser.ast.Node) * L112 setAsParentNodeOf( this .init) -&qt; com.github.javaparser.ast.Node.setAsParentNodeOf(com.github.javaparser.ast.Node) * L121 setAsParentNodeOf( this .init) -&qt; com.github.javaparser.ast.Node.setAsParentNodeOf(com.github.javaparser.ast.Node) * L128 getParentNodeOfType(NodeWithElementType. class ) -&qt; com.github.javaparser.ast.Node.getParentNodeOfType(java.lang.Class<T&qt;) * L130 wrapInArrayTypes(elementType.getElementType(), elementType.getArrayBracketPairsAfterElementType(), getId().getArrayBracketPairsAfterId()) -&qt; com.github.javaparser.ast.type.ArrayType.wrapInArrayTypes(com.github.javaparser.ast.type.Type, java.util.List<com.github.javaparser.ast.ArrayBracketPair&qt;...) * L130 elementType.getElementType() -&qt; com.github.javaparser.ast.nodeTypes.NodeWithElementType.getElementType() * L131 elementType.getArrayBracketPairsAfterElementType() -&qt; com.github.javaparser.ast.nodeTypes.NodeWithElementType.getArrayBracketPairsAfterElementType() * L132 getId().getArrayBracketPairsAfterId() -&qt; com.github.javaparser.ast.body.VariableDeclaratorId.getArrayBracketPairsAfterId() * L132 getId() -&qt; com.github.javaparser.ast.body.VariableDeclarator.getId() * L137 ArrayType.unwrapArrayTypes(type) -&qt; com.github.javaparser.ast.type.ArrayType.unwrapArrayTypes(com.github.javaparser.ast.type.Type) * L138 getParentNodeOfType(NodeWithElementType. class ) -&qt; com.github.javaparser.ast.Node.getParentNodeOfType(java.lang.Class<T&qt;) * L142 nodeWithElementType.setElementType(unwrapped.a) -&qt; com.github.javaparser.ast.nodeTypes.NodeWithElementType.setElementType(com.github.javaparser.ast.type.Type<?&qt;) * L143 nodeWithElementType.setArrayBracketPairsAfterElementType( null ) -&qt; com.github.javaparser.ast.nodeTypes.NodeWithElementType.setArrayBracketPairsAfterElementType(java.util.List<com.github.javaparser.ast.ArrayBracketPair&qt;) * L144 getId().setArrayBracketPairsAfterId(unwrapped.b) -&qt; com.github.javaparser.ast.body.VariableDeclaratorId.setArrayBracketPairsAfterId(java.util.List<com.github.javaparser.ast.ArrayBracketPair&qt;) * L144 getId() -&qt; com.github.javaparser.ast.body.VariableDeclarator.getId() |
Здание АСТ
Построить AST довольно просто, вы просто вызываете этот метод:
1
|
JavaParser.parse(file) |
Я также использовал несколько методов для навигации по AST и получения определенных узлов. В частности, я буду использовать это, чтобы принимать только вызовы методов. Если вам интересно, они выглядят так:
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
|
class SpecificNodeIterator<T&qt;( private val type: Class<T&qt;, private val nodeHandler: SpecificNodeIterator.NodeHandler<T&qt;) { interface NodeHandler<T&qt; { fun handle(node: T): Boolean } fun explore(node: Node) { if (type.isInstance(node)) { if (!nodeHandler.handle(type.cast(node))) { return } } for (child in node.childrenNodes) { explore(child) } } } // this is a method extension: we had this method to the existing class "Node" fun <T&qt; Node.descendantsOfType(type: Class<T&qt;) : List<T&qt; { val descendants = LinkedList<T&qt;() SpecificNodeIterator(type, object : SpecificNodeIterator.NodeHandler<T&qt; { override fun handle(node: T): Boolean { descendants.add(node) return true } }).explore( this ) return descendants } |
Укажите Тип решения
Что, черт возьми, это Решатель типов? Это объект, который знает, где искать классы. При обработке исходного кода вы обычно будете иметь ссылки на код, который еще не скомпилирован, но он просто присутствует в других исходных файлах. Вы также можете использовать классы, содержащиеся в JAR или классы из стандартных библиотек Java. Вы просто должны сказать своему TypeSolver, где искать классы, и он выяснит это.
В нашем примере мы проанализируем исходный код из проекта JavaParser (как мета ?!). Этот проект имеет исходный код в двух разных каталогах, для правильного исходного кода и кода, сгенерированного JavaCC (вы можете игнорировать, что такое JavaCC, он вам не подходит). Мы, конечно, также используем классы из стандартных библиотек Java. Вот так выглядит наш TypeSolver:
1
2
3
4
5
6
7
|
fun typeSolver() : TypeSolver { val combinedTypeSolver = CombinedTypeSolver() combinedTypeSolver.add(JreTypeSolver()) combinedTypeSolver.add(JavaParserTypeSolver(File( "src/main/resources/javaparser-core" ))) combinedTypeSolver.add(JavaParserTypeSolver(File( "src/main/resources/javaparser-generated-sources" ))) return combinedTypeSolver } |
Наше приложение
Здесь мы вызываем JavaParserFacade, один из классов, предоставляемых JavaSymbolSolver. Мы просто берем вызов метода и передаем его в метод метода JavaParserFacade. Мы получаем MethodUsage (который в основном является объявлением метода + значение типов параметров для этого конкретного вызова). Из него мы получаем MethodDeclaration и печатаем квалифицированную подпись, т. Е. Полное имя класса, за которым следует подпись метода. Вот как мы получаем окончательный результат:
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
var solved = 0 var unsolved = 0 var errors = 0 fun processJavaFile(file: File, javaParserFacade: JavaParserFacade) { println(file) JavaParser.parse(file).descendantsOfType(MethodCallExpr:: class .java).forEach { print( " * L${it.begin.line} $it " ) try { val methodRef = javaParserFacade.solve(it) if (methodRef.isSolved) { solved++ val methodDecl = methodRef.correspondingDeclaration println( " -> ${methodDecl.qualifiedSignature}" ) } else { unsolved++ println( " ???" ) } } catch (e: Exception) { println( " ERR ${e.message}" ) errors++ } catch (t: Throwable) { t.printStackTrace() } } } |
Выводы
Есть так много работы, но в основном JavaSymbolSolver выполняет всю тяжелую работу за сценой. Когда у вас есть узел AST, вы можете выбросить его в класс JavaParserFacade, и он вернет вам всю необходимую информацию: он найдет соответствующие типы, поля, методы и т. Д.
Проблема в том, что… нам нужно больше документации и отзывов от пользователей. Я надеюсь, что некоторые из вас начнут использовать JavaSymbolSolver и расскажут нам, как мы можем улучшить его.
Кроме того, на прошлой неделе JavaSymbolSolver был перемещен в организацию JavaParser. Это означает, что в будущем мы будем более тесно сотрудничать с проектом JavaParser.
Код доступен на GitHub: java-symbol-solver-examples
Ссылка: | Разрешите вызовы методов в коде Java, используя JavaSymbolSolver от нашего партнера по JCG |