WikipediaEnLosColegios/ServidorLamp

De Wiki Zoociedad

Las principales ventajas de este metodo:

  • Solo se necesita realizar una instalación en el colegio

Las principales desventajes de este metodo:

  • Los links no quedan completamente funcionales, (estamos averiguando como solucionar esto)
  • No se tienen las imagenes

Contenido

Descarga de archivos

El software mediawiki se descarga de aca:

http://www.mediawiki.org/wiki/Download

Instrucciones oficiales para la instalación

http://www.mediawiki.org/wiki/Manual:Running_MediaWiki_on_Ubuntu

Para la documentación vamos a suponer que se hace la instalación en /var/www/wiki

Los archivos de la wikipedia se encuentran en esta dirección:

http://download.wikimedia.org/backup-index.html

Los archivos de la wikipedia en español están en esta dirección:

http://download.wikimedia.org/eswiki/latest/

Los archivos a descargar son los siguientes:

  • eswiki-latest-pages-articles.xml.bz2

La herramienta que vamos a utilizar es mwdumper, se puede descargar en:

http://www.mediawiki.org/wiki/Mwdumper
http://download.wikimedia.org/tools/

Programas necesarios

sudo apt-get install mediawiki-math mysql-server-5.1

Ajustes a la instalación por defecto

Vamos a la carpeta de imágenes las creamos y les damos permiso para que mediawiki las utilice

jag2kn@zeus:~$ cd /var/www/wiki/images
jag2kn@zeus:/var/www/wiki/images$ sudo mkdir archive
jag2kn@zeus:/var/www/wiki/images$ sudo mkdir thumb
jag2kn@zeus:/var/www/wiki/images$ sudo mkdir temp
jag2kn@zeus:/var/www/wiki/images$ sudo chmod 777 archive thumb temp

En el archivo de configuración activamos el uso de TeX para las imagenes

$wgUseTeX           = true;

Subir un dump

Para subir los archivos descargados a nuestra instalación utilizamos mwdumper y mysql sobre los archivos:

  • mwDumper
    • eswiki-20090908-pages-articles.xml.bz2
    • eswiki-latest-stub-articles.xml.gz
  • mysql directo
    • eswiki-20090908-imagelinks.sql
    • eswiki-20090908-templatelinks.sql
    • eswiki-latest-category.sql
    • eswiki-latest-image.sql
    • eswiki-latest-redirect.sql
java -jar mwdumper.jar --format=sql:1.5 eswiki-20090908-pages-articles.xml.bz2 | mysql -u root -p wikidb
1.000 pages (95,193/sec), 1.000 revs (95,193/sec)
2.000 pages (99,84/sec), 2.000 revs (99,84/sec)
3.000 pages (123,305/sec), 3.000 revs (123,305/sec)
4.000 pages (139,329/sec), 4.000 revs (139,329/sec)
5.000 pages (156,006/sec), 5.000 revs (156,006/sec)
.....
1.325.000 pages (1.494,745/sec), 1.325.000 revs (1.494,745/sec)
1.326.000 pages (1.495,097/sec), 1.326.000 revs (1.495,097/sec)
1.327.000 pages (1.495,51/sec), 1.327.000 revs (1.495,51/sec)
1.328.000 pages (1.495,649/sec), 1.328.000 revs (1.495,649/sec)
1.329.000 pages (1.496,106/sec), 1.329.000 revs (1.496,106/sec)
1.330.000 pages (1.496,944/sec), 1.330.000 revs (1.496,944/sec)
1.330.372 pages (1.497,15/sec), 1.330.372 revs (1.497,15/sec)

java -jar mwdumper.jar --format=sql:1.5 eswiki-latest-stub-articles.xml.gz | mysql -u root -p wikidb
......
1.330.000 pages (23.519,426/sec), 1.330.000 revs (23.519,426/sec)
1.330.372 pages (23.519,349/sec), 1.330.372 revs (23.519,349/sec)

mysql -u root -p wikidb < eswiki-20090908-imagelinks.sql
mysql -u root -p wikidb < eswiki-20090908-templatelinks.sql
mysql -u root -p wikidb < eswiki-latest-category.sql
mysql -u root -p wikidb < eswiki-latest-image.sql
mysql -u root -p wikidb < eswiki-latest-redirect.sql


y corremos la actualización de los elementos en el wiki

cd /var/www/wiki/maintenance
php rebuildall.php
** Rebuilding fulltext search index (if you abort this will break searching; run this script again to fix):
Dropping index...
Rebuilding index fields for 13399 pages...
13000
Rebuild the index...
** Rebuilding recentchanges table:
Loading from page and revision tables...
$wgRCMaxAge=604800 (7 days)
Updating links and size differences...
Loading from user, page, and logging tables...
Flagging bot account edits...
Flagging auto-patrolled edits...


** Rebuilding links tables -- this can take a long time. It should be safe to abort via ctrl+C if you get bored.
Refreshing links table.
Starting from page_id 1 of 13399.
100
200
.....
13200
13300
Done.

Errores proceso instalación

Warning: xml_parse(): Unable to call handler out_() in /var/www/wiki/includes/Import.php on line 437

Call Stack:
    0.0017     185848   1. {main}() /var/www/wiki/maintenance/importDump.php:0
    0.2389    3874392   2. BackupReader->importFromStdin() /var/www/wiki/maintenance/importDump.php:173
    0.2389    3875144   3. BackupReader->importFromHandle() /var/www/wiki/maintenance/importDump.php:127
    0.2503    4457176   4. WikiImporter->doImport() /var/www/wiki/maintenance/importDump.php:145
  224.0966   16696712   5. xml_parse() /var/www/wiki/includes/Import.php:437

http://galileo.lct.jussieu.fr/~frames/mediawiki/index.php/Mediawiki_How_To_import_xml_wiki_file

Problema con el formato de una columna en la base de datos:

`SELECT  img_size, img_width, img_height, img_bits,img_media_type, img_major_mime,
img_minor_mime, img_metadata, img_timestamp, img_sha1,img_user, img_user_text, img_description  
FROM `image`  WHERE img_name = 'Bułhakow.jpg'  LIMIT 1  `
desde la función `LocalFile::loadFromDB`.
MySQL retornó el error `1267: Illegal mix of collations (latin1_bin,IMPLICIT) and (utf8_general_ci,COERCIBLE) for operation '=' (localhost)`.
<pre>

 ALTER TABLE `image` CHANGE `img_name` `img_name` VARCHAR( 255 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL

Documentación

http://meta.wikimedia.org/wiki/Data_dumps#bzip2

Links

http://en.wikipedia.org/wiki/Wikipedia_database http://meta.wikimedia.org/wiki/Data_dumps

Herramientas
LANGUAGES