União de bases e tesauro UFSCar

Passo-a-passo para unir metadados de bases de dados diferentes no VantagePoint - exemplo: Lattes e Web of Science (WOS)

Antes de iniciar a união dos arquivos é necessário verificar se ambos os campos estão adequados, isto é, se possuem informações que podem ser comparadas. No exemplo abaixo, foi necessário adequar o campo DOI do Lattes, pois havia, em grande parte dos registros com DOI válido, o seguinte endereço: http://dx.doi.org/ antes do número do DOI, diferente da base da Web of Science (WoS). Para retirar, optou-se por acessar o arquivo de configuração (.conf) do Lattes. Para isto, o arquivo de configuração SyncLattes 1.4 foi aberto, através da opção Tools > Import Engine Editor, conforme ilustra a Figura 1 e, no campo DOI, adicionada a definição de campo para procurar e substituir a string http://dx.doi.org/ por vazio, na Função Find and Replace:

uniao-bases-1.png

Figura 1 – Acesso ao arquivo de configuração
 

Desta forma, o campo DOI do Lattes foi adequado para efetuar a comparação com o valor DOI da base da WoS.

Regex to find :

http://dx.doi.org/

String to replace with :

 

 

uniao-bases-2.png

Figura 2 - Realizando a adequação do campo DOI, através da tela de configuração do VantagePoint

 

Feche a janela de configuração e volte na aba SUMMARY do Vantage. Clique com o botão direito no campo DOI e exclua o campo (Delete field). Será necessário apagar e incluir o campo DOI no Summary, visando atualizá-lo.

Para incluí-lo novamente, siga os passos abaixo:

  • Clique em FIELDS > Incremental Import... > Change Dataset Properties > Change Database Configurations > Replace Database > SyncLattes v1.4.conf > OK
  • Clique em SyncLattes v1.4 > OK
  • Abrirá uma janela de mensagem: ... VantagePoint will search... > Clique em SIM
  • Outra mensagem: xxxx changes were made. > OK
  • Assign Databases: OK
  • DataSet Properties: OK
  • Choose Database and Fields : clique no campo DOI > OK

Pronto, o campo DOI foi incluído e adequado!

Após a adequação, os arquivos das bases Web of Science (WoS) e Lattes poderão ser então comparados, usando a função List Comparison, formando o Grupo Lattes no arquivo da base da Wos e vice e versa.

OBSERVAÇÃO: Antes de iniciar o processo de comparar e agrupar as bases, é importante que ambos os arquivos (ex: WoS e Lattes) estejam abertos em uma única área de trabalho do VantagePoint, conforme ilustra Figura 3:

uniao-bases-3.PNG

Figura 3 - Mantendo os arquivos de ambas as bases abertos em uma única área de trabalho do VantagePoint

 

Iniciando o processo de comparar usando a opção GROUPS > List Comparison...

 uniao-bases-4.png

Figura 4 - Iniciando o processo de comparação das bases

 

Selecione o campo desejado para a comparação. O exemplo ilustrado na Figura 5 mostra a comparação pelo campo DOI:

uniao-bases-5.png

Figura 5 - Criação do Grupo LATTES para comparar o campo DOI da base da WoS com o campo DOI da base Lattes

 

Após a comparação, dê dois cliques no Grupo para ordenar os campos, visando facilitar a verificação de quais registros foram encontrados na comparação.

uniao-bases-6.png

Figura 6 - Ordenando os registros pelo grupo LATTES

 

Na sequência, salve os registros selecionados em um novo arquivo, usando a opção: FILE > Create Sub-dataset ... > OK.

uniao-bases-7.PNG

Figura 7 - Criando um Sub-dataset (novo arquivo) com os registros encontrados pelo grupo LATTES

 

Para realizar a comparação inversa, basta repetir os passos anteriores, agrupando pela nova base e na sequencia salvar em novo arquivo. Obs.: os registros encontrados deverão ser a mesma quantidade encontrada anteriormente.

uniao-bases-8.png

Figura 8 – Comparação entre o campo DOI do Lattes com o campo DOI da WoS

 

 

 uniao-bases-9.PNG

Figura 9 - Criando um Sub-dataset (novo arquivo) com os registros encontrados pelo grupo WoS

 

UNINDO OS ARQUIVOS

 

Feche os arquivos completos do Lattes e WoS e deixe abertos somente os arquivos resultantes dos agrupamentos (Lattes e WoS).

Importante: ambas as bases precisam estar na mesma área de trabalho do VantagePoint e não em janelas separadas, conforme mostra a Figura 10 a seguir:

uniao-bases-10.PNG

Figura 10 - Arquivos do Lattes e WoS na mesma área de trabalho do VantagePoint

 

Para realizar a união dos arquivos, utilize a opção TOOLS > Data Fusion...

uniao-bases-11.PNG

Figura 11 - Adicionando todos os campos de ambas as bases para formar um novo conjunto de dados (ainda duplicados)

 

uniao-bases-12.png

Figura 12 - Tela de aviso da formação do novo conjunto de dados

 

Caso apareça uma tela de aviso, clique em Sim.

Após a união dos arquivos, ainda duplicados, salve como um novo arquivo.

uniao-bases-13.png

Figura 13 – Salvando a união dos registros do Lattes e WoS (ainda duplicados)

 

Para resolver o problema da duplicação, crie um novo campo (DOI + DOI) através da união do campo DOI de ambas as bases, clicando na opção FIELDS > Merge Fields...

uniao-bases-14.PNG

Figura 14 – Criando um novo campo (DOI + DOI) através da união do campo DOI de ambas as bases

 

uniao-bases-15.PNG

Figura 15 - Combinando os registros pelo campo DOI + DOI

 

Após a realização da junção, será criado um novo campo DOI + DOI no SUMMARY com os registros sem duplicação.

uniao-bases-16.png

Figura 16 - Novo arquivo resultante da união das bases (sem duplicação) 

 

Nessa etapa é importante remover registros duplicados, caso existam.

 uniao-bases-17.png

Figura 17 – Removendo os registros duplicados

 

Seleciona o campo fundido e clica em OK. Será gerado um novo arquivo vpt. com os dados fundidos sem duplicatas.

uniao-bases-18.png

Figura 18 – Utilizando o código UT como campo único, para a remoção das duplicatas.

 

A tela de Exibição de Registro mostrará todos os metadados juntos, de ambas as bases.

uniao-bases-19.PNG

Figura 19- Metadados de ambas as bases em um único registro

 

Tesauro para o Controle de Autoridade da UFSCar

**#ufscar - universidade federal de sao carlos
100 1 ^agroecol desenvolvimento rural ufscar pesquis$
100 1 ^cac sor fed univ sao carlos$
100 1 ^cac sor fed univ sao carlos$
100 1 ^cca ufscar$
100 1 ^ccbs ufscar$
100 1 ^ccdm ufscar$
100 1 ^ccet fed univ sao carlos$
100 1 ^ccts ppgdbc ufscar$
100 1 ^cdmf ufscar univ fed sao carlos$
100 1 ^cech ufscar$
100 1 ^cmdmc$
100 1 ^cmdmc liec ufscar$
100 1 ^dema ufscar$
100 1 ^dept bot ufscar$
100 1 ^dept enfermagem ufscar$
100 1 ^dept engn mat$
100 1 ^dept engn mat ufscar$
100 1 ^dept fis ufscar$
100 1 ^dept hidrobiol ufscar$
100 1 ^dept mat engn$
100 1 ^dept mat engn ufscar rod$
100 1 ^dept matemat ufscar$
100 1 ^dept psicol ufscar$
100 1 ^dept quim ufscar$
100 1 ^deq ufscar$
100 1 ^des ufscar$
100 1 ^desufscar$
100 1 ^df ufscar$
100 1 ^df ufscar univ fed sao carlos$
100 1 ^dipartimento fis dq ufscar$
100 1 ^dipartimento fis & dq ufscar$
100 1 ^doutor ciencias sociais ufscar$
100 1 ^doutora engn producao ufscar$
100 1 ^dq ufscar$
100 1 ^dq ufscar univ fed sao carlos$
100 1 ^drnpa ufscar$
100 1 ^fd univ sao carlos$
100 1 ^fdn univ fed sao carlos$
100 1 ^fed univ s ao carlos ufscar$
100 1 ^fed univ s carlos$
100 1 ^fed univ saeo carlos ufscar$
100 1 ^fed univ sao carlos$
100 1 ^fed univ sao carlos dc ufscar$
100 1 ^fed univ sao carlos dep ufscar$
100 1 ^fed univ sao carlos deps ufscar$
100 1 ^fed univ sao carlos ppeq ufscar$
100 1 ^fed univ sao carlos ppg eq ufscar$
100 1 ^fed univ sao carlos ppgeq ufscar$
100 1 ^fed univ sao carlos sp ufscar$
100 1 ^fed univ sao carlos ufs car$
100 1 ^fed univ sao carlos ufscar$
100 1 ^fed univ sao carlos ufscar rodovia$
100 1 ^fed univ sao carols$
100 1 ^fed univ savo carlos ufscar$
100 1 ^fed univ sdo carlos ufscar$
100 1 ^fed univ selo carlos ufscar$
100 1 ^fed univ silo carlos ufscar$
100 1 ^fed univ soo carlos ufscar$
100 1 ^fed univ ufscar$
100 1 ^federal univ sao carlos$
100 1 ^fisiol univ fed sao carlos$
100 1 ^fundacao univ fed sao carlos$
100 1 ^grad program mat sci & engn ppgcem$
100 1 ^grad program psychol ufscar$
100 1 ^grad sch biotechnol & environm monitoring ufscar$
100 1 ^grad sch evolut genet & mol biol ufscar$
100 1 ^inctmn dq univ fed sao carlos$
100 1 ^inctmn fed univ sao carlos$
100 1 ^inst fis sao carlos$
100 1 ^inst quim sao carlos$
100 1 ^joint fed univ sao carlos ufscar$
100 1 ^joint grad program physiol sci pipgcf ufscar unes$
100 1 ^joint grad program physiol sci ufscar unesp$
100 1 ^joint grad program psychol ufscar$
100 1 ^joint ufscar unesp grad program physiol sci$
100 1 ^joint ufscar unesp$
100 1 ^lab biogeoquim ambiental dq ufscar$
100 1 ^lab rmn ufscar$
100 1 ^liec dq univ fed sao carlos$
100 1 ^liec ufscar$
100 1 ^liec univ fed sao carlos$
100 1 ^matemat & educ ufscar$
100 1 ^nanofael liec dq ufscar$
100 1 ^phys inst sao carlos$
100 1 ^pipgcf ufscar unesp$
100 1 ^ppg cem ufscar$
100 1 ^ppg ern ufscar$
100 1 ^ppgcem ufscar$
100 1 ^ppgcem univ fed sao carlos$
100 1 ^programa posgrad ciencia & engn mat ppg cem ufsca$
100 1 ^psychobiol grp ufscar$
100 1 ^san carlos fed univ$
100 1 ^san carlos univ$
100 1 ^sao carlos fed univ$
100 1 ^sao carlos fed univ ufscar$
100 1 ^sao carlos univ$
100 1 ^ufs car$
100 1 ^ufscar$
100 1 ^ufscar cca$
100 1 ^ufscar cmdmc liec$
100 1 ^ufscar ctr ciencias agr$
100 1 ^ufscar dema$
100 1 ^ufscar des$
100 1 ^ufscar fed univ sao carlos$
100 1 ^ufscar fed univ saocarlos$
100 1 ^ufscar physiotherapy$
100 1 ^ufscar ppg diversidade biol conservacao$
100 1 ^ufscar programa posgrad genet evolucao$
100 1 ^ufscar rod$
100 1 ^ufscar rod washington luiz$
100 1 ^ufscar rodovia washington luis$
100 1 ^ufscar sorocaba$
100 1 ^ufscar sp$
100 1 ^ufscar sp brazil$
100 1 ^ufscar unesp$
100 1 ^ufscar unesp araraquara$
100 1 ^ufscar unesp rod$
100 1 ^ufscar unesp sao carlos$
100 1 ^ufscar univ fed sao carlos$
100 1 ^univ fed s carlos$
100 1 ^univ fed sa carlos$
100 1 ^univ fed san carlos$
100 1 ^univ fed sao carlos$
100 1 ^univ fed sao carlos cca ufscar$
100 1 ^univ fed sao carlos ccbs ufscar$
100 1 ^univ fed sao carlos crr ufscar sorocaba$
100 1 ^univ fed sao carlos dbee ufscar$
100 1 ^univ fed sao carlos dc ufscar$
100 1 ^univ fed sao carlos dema ufscar$
100 1 ^univ fed sao carlos dema$
100 1 ^univ fed sao carlos dgth ufscar$
100 1 ^univ fed sao carlos dm$
100 1 ^univ fed sao carlos ppgern$
100 1 ^univ fed sao carlos rodovia washington luiz$
100 1 ^univ fed sao carlos sp$
100 1 ^univ fed sao carlos ufs car$
100 1 ^univ fed sao carlos ufscar$
100 1 ^univ fed sao carlos ufscar sp$
100 1 ^univ fed sar carlos ufscar$
100 1 ^univ fed sclo carlos ufscar$
100 1 ^univ fed silo carlos$
100 1 ^univ fed so carlos$
100 1 ^univ fed so carlos ufscar$
100 1 ^univ fed soa carlos$
100 1 ^univ san carlos$
100 1 ^univ sao carlos$
100 1 ^univ sao carlos ufscar$
100 1 ^univ sao carlus$
100 1 ^universidade federal de são carlos $
100 1 ^universidade federal de são carlos$
100 1 ^vitreous mat lab ufscar$

 

Como citar: REIS, J. E.; CAMARGO, R. C.; SARVO, D. O.; AMARAL, R. M. Indicadores da produção científica a partir de controle de autoridade: o caso UFSCar. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO – ENANCIB, 20., 2019, Florianópolis. Anais... Florianópolis: UFSC, 2019. Disponível em: https://conferencias.ufsc.br/index.php/enancib/2019/paper/view/548/921.