Documentación para la solución de problemas que encontramos en la vida bibliotecaria.
Si quisieras contribuir escribe un correo a segutierrez (arroba) colmex.mx
Para editar textos: https://onlinetexttools.com/
Para editar CSVs https://onlinecsvtools.com/
Para PNGs https://onlinepngtools.com/
- Abrir terminal (botón windows + escribir "terminal")
- Se copia la ruta del archivo donde están tus archivos, por ejemplo: "C:\Users\xxx\Dropbox\A_Proyectos\Zapata\xxx" (que está en la barra superior de tu explorador de archivos)
- En la terminal se escribe "cd" y luego botón derecho (eso hace que se pegue la ruta "C:...."). Por ejemplo:
cd C:\Users\xxx\Dropbox\A_Proyectos\Zapata\xxx
- Una vez hecho esto se escribe:
dir /s > nombres_de_mis_archivos.txt
(donde dir significa "enlistar archivos"; /s significa enlistar subcarpetas; > significa "guardar en"; y después se escribe el nombre de archivo donde se va a guardar)
Sigues los pasos 1, 2 y 3 de 1)
- Una vez hecho esto se escribe:
dir /a /s /b > misarchivos.csv
(donde dir significa "enlistar archivos"; /a significa "muestra todos los archivos" (viene de "all" en inglés); /s significa "enlista las subcarpetas"; /b significa "muéstralos en formato simple" (viene de "bare" en inglés); > significa "guardar en"; y después se escribe el nombre de archivo donde se va a guardar)
Sigues los pasos 1, 2 y 3 de 1)
- Una vez hecho esto se escribe:
ren *.tei *xml
(para cambiar todos los .tei a .xml
cmd /e:on /v:on /c "for %f in ("* *.txt") do (set "n=%~nxf" & set "n=!n: =_!" & ren "%~ff" "!n!" )"
FORFILES /M *.pdf /C "cmd /c pdftotext @file"
Primero se tienen que descargar https://www.xpdfreader.com/download.html y establecer correctamente las variables de entorno. Para más detalles ver: https://prezi.com/bqmznyehjtul/extraccion-de-texto/
import os
import unidecode #para esto habrá que hacer pip install unidecode
src_dir = #aquí se pone la dirección de la carpeta
for file_name in os.listdir(src_dir):
normalized = unidecode.unidecode(file_name)
#print(file_name, normalized)
os.rename(os.path.join(src_dir,file_name), os.path.join(src_dir, normalized))
os.chdir("") #aquí se pone la dirección de la carpeta
os.getcwd()
from glob import glob
pre = "2011_" #<- aquí se agrega el prefijo que se quiera poner
[os.rename(f, "{}{}".format(pre, f)) for f in glob("*.pdf")]
- Instalar Anaconda para tu sistema operativo https://www.anaconda.com/download/
- Instalar orange3-text: https://github.com/biolab/orange3-text
a) En el Anaconda Prompt primero añadir "add conda-forge" a tus canalees:
conda config --add channels conda-forge
b) Después se instala orange text
conda install orange3-text
c) Luego se abre el programa con:
python -m Orange.canvas
- Instalar con pip
pip install citedbyapi
- Abrir en terminal python o abrir IDE con interpretador
from citedby import client
client.RestfulClient()
cl.citedby_doi("10.1016/j.jenvp.2005.08.002")
- Instalar paquete
install.packages("bibliometrix", dependencies= TRUE) ###instala el paquete bibliometrix y todas las dependencias
- Leer archivo bib exportado desde Scopus
archivo <- readFiles("http://www.bibliometrix.org/datasets/savedrecs.bib")
- Convertir archivo bib a df
df <- convert2df(archivo, dbsource = "scopus", format = "bibtex")